提问者:小点点

如何在selenium中使用chrome网络驱动程序在python中下载文件?


根据这里和这里的帖子,我尝试在selenium中使用chrome网络驱动程序来下载文件。这是目前为止的代码

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_argument("--disable-extensions")
chrome_options.add_experimental_option("profile.default_content_settings.popups", 0)
chrome_options.add_experimental_option("download.prompt_for_download", "false")
chrome_options.add_experimental_option("download.default_directory", "/tmp")

driver = webdriver.Chrome(chrome_options=chrome_options)

但仅此一项就会导致以下错误:

WebDriverException: Message: unknown error: cannot parse capability: chromeOptions
from unknown error: unrecognized chrome option: download.default_directory
  (Driver info: chromedriver=2.24.417424 (c5c5ea873213ee72e3d0929b47482681555340c3),platform=Linux 4.10.0-37-generic x86_64)

那么如何解决这个问题呢?我必须使用这个“能力”吗?如果是,具体如何?


共3个答案

匿名用户

试试这个。在窗户上执行

如何在Chrome中控制SeleniumPython绑定文件的下载

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

options = Options()
options.add_experimental_option("prefs", {
  "download.default_directory": r"C:\Users\xxx\downloads\Test",
  "download.prompt_for_download": False,
  "download.directory_upgrade": True,
  "safebrowsing.enabled": True
})

匿名用户

我认为使用WebDriver保存任意文件(即图像)的最简单方法是执行将保存文件的JavaScript。根本不需要配置!

我使用这个库FileSaver. js轻松保存具有所需名称的文件。

from selenium import webdriver
import requests

FILE_SAVER_MIN_JS_URL = "https://raw.githubusercontent.com/eligrey/FileSaver.js/master/dist/FileSaver.min.js"

file_saver_min_js = requests.get(FILE_SAVER_MIN_JS_URL).content

chrome_options = webdriver.ChromeOptions()
driver = webdriver.Chrome('/usr/local/bin/chromedriver', options=chrome_options)

# Execute FileSaver.js in page's context
driver.execute_script(file_saver_min_js)

# Now you can use saveAs() function
download_script = f'''
    return fetch('https://cdn.sstatic.net/Sites/stackoverflow/company/img/logos/so/so-logo.svg?v=a010291124bf',
        {{
            "credentials": "same-origin",
            "headers": {{"accept":"image/webp,image/apng,image/*,*/*;q=0.8","accept-language":"en-US,en;q=0.9"}},
            "referrerPolicy": "no-referrer-when-downgrade",
            "body": null,
            "method": "GET",
            "mode": "cors"
        }}
    ).then(resp => {{
        return resp.blob();
    }}).then(blob => {{
        saveAs(blob, 'stackoverflow_logo.svg');
    }});
    '''

driver.execute_script(download_script)
# Done! Your browser has saved an SVG image!

匿名用户

一些提示:

>

  • chromium和chrome驱动程序应该有相同的版本。

    通常chromium包里应该有chromeriver,你可以在安装目录中找到它。如果您使用的是ubuntu/debian,请执行dpkg-L chromic-chromeriver

    有一个正确的Chrome首选项配置。

    正如萨蒂什所说,使用选项。add_experimental_option("prefs",…)来配置selenium chrome。但是有时配置可能会随着时间的推移而改变。获得最新和可行的prefs的困扰方法是在chromium配置目录中检查它。例如,

    • 在Xorg桌面中启动chromium
    • 更改菜单中的设置
    • 退出铬
    • 找出中的真实设置~/. config/chromium/默认/首选项
    • 阅读它,选择你需要的确切选项。

    在我的例子中,代码是:

    from selenium import webdriver
    from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
    
    options = webdriver.ChromeOptions()
    options.gpu = False
    options.headless = True
    options.add_experimental_option("prefs", {
        "download.default_directory" : "/data/books/chrome/",
        'profile.default_content_setting_values.automatic_downloads': 2,
        })
    
    desired = options.to_capabilities()
    desired['loggingPrefs'] = { 'performance': 'ALL'}
    driver = webdriver.Chrome(desired_capabilities=desired)