我正在使用selenium从这个页面自动下载csv格式的文件:
https://catalog.data.gov/dataset?tags=crime
这是我正在使用的代码:
profile = webdriver.FirefoxProfile()
profile.set_preference("browser.download.folderList", 2)
profile.set_preference("browser.download.manager.showWhenStarting", False)
profile.set_preference("browser.download.dir", '/home/luis/Desktop/data/')
profile.set_preference("browser.helperApps.neverAsk.saveToDisk", "text/csv")
driver = webdriver.Firefox(firefox_profile=profile)
driver.get(url)
time.sleep(2)
download_button = driver.find_element_by_xpath('//*[@id="content"]/div[2]/div[2]/section[1]/div[2]/ul/li[14]/div/ul/li[1]/a')
download_button.click()
这里设置了下载文件夹:
profile.set_preference("browser.download.dir", '/home/luis/Desktop/data/')
如何选择保存文件的名称?可以是下载时定义的名称吗?
我的意思是这样的:
For name in names:
download_button = driver.find_element_by_xpath('//*[@id="content"]/div[2]/div[2]/section[1]/div[2]/ul/li[14]/div/ul/li[{}]/a'.format(name))
download_button.click()
save_file_as(name)
您无法通过selenium控制下载文件命名。
您可以做的是使用目录观察者/观察者来检测文件何时下载,然后相应地重命名它。请参阅包含更多后续详细信息的此答案。
import os,glob
def get_last_filename_and_rename(save_folder, new_filename):
files = glob.glob(save_folder + '/*')
max_file = max(files, key=os.path.getctime)
filename = max_file.split("/")[-1].split(".")[0]
new_path = max_file.replace(filename, new_filename)
os.rename(max_file, new_path)
return new_path
只是一个代码示例。找到并重命名最后下载的文件。*new_filename
不包括扩展名,它继承自原始文件。