提问者:小点点

自动下载,包括密码和特定的在线点击


我想使用cron每天下载一次投资组合信息,增加了两个复杂性:

  1. 它需要密码

如果我使用:

wget -U Chromium --user='e-address' --password='pass' \
    https://www.google.com/finance/portfolio > "file_"`date +"%d-%m-%Y"`+.csv

我得到的答复是:

========================================================================= 
--2013-10-20 12:16:13--  https://www.google.com/finance/portfolio 
Resolving www.google.com (www.google.com)... 74.125.195.105, 74.125.195.103, 74.125.195.99, ... 
Connecting to www.google.com (www.google.com)|74.125.195.105|:443... connected. 
HTTP request sent, awaiting response... 200 OK 
Length: unspecified [text/html] 
Saving to: ‘portfolio’ 

[ <=>                                   ] 16,718      --.-K/s   in 0.04s   

2013-10-20 12:16:13 (431 KB/s) - ‘portfolio’ saved [16718] 
==========================================================================

它保存到一个名为“公文包”的文件中,而不是我要求它保存的位置(“文件”日期“%d-%m-%Y”.csv)。当我在浏览器中查看“公文包”时,它说我需要登录我的帐户,即不注意我包含的用户和密码信息。

如果我将鼠标悬停在“下载到电子表格”链接上得到的字符串添加到网址:-

wget -U Chromium --user='e-address' --password='pass' \
    https://www.google.com/finance/portfolio?... > "file_"`date +"%d-%m-%Y"`+.csv

我得到:

[1] 5175 
[2] 5176 
[3] 5177 
[4] 5178 
--2013-10-20 12:44:56--  https://www.google.com/finance/portfolio?pid=1 
Resolving www.google.com (www.google.com)... [2]   Done                    output=csv 
[3]-  Done                    action=view 
[4]+  Done                    pview=pview 
hg21@hg21-sda2:~$ 74.125.195.106, 74.125.195.103, 74.125.195.104, ... 
Connecting to www.google.com (www.google.com)|74.125.195.106|:443... connected. 
HTTP request sent, awaiting response... 200 OK 
Length: unspecified [text/html] 
Saving to: ‘portfolio?pid=1’ 

[ <=>                                   ] 16,768      --.-K/s   in 0.05s   

2013-10-20 12:44:56 (357 KB/s) - ‘portfolio?pid=1.1’ saved [16768] 

在这一点上,它挂着。它在此时写入的文件('投资组合?Pid=1')与之前使用的wget的'投资组合'文件相同。

如果我输入密码,它将继续:

pass: command not found 
[1]+  Done                    wget -U Chromium --user="e-address" --password='pass' https://www.google.com/finance/portfolio?pid=1 
[1]+  Done                    wget -U Chromium --user="e-address" --password='pass' https://www.google.com/finance/portfolio?pid=1 

非常感谢您的帮助。


共1个答案

匿名用户

这里有几个问题:

1) wget未保存到正确的文件名

使用-O选项代替

更改<代码>

提示:如果使用日期“%Y-%m-%d”,文件将按时间顺序自然排序。

这本质上是wget命令的重复,用于下载文件并保存为不同的文件名

有关选项,请参见man wget

2)wget正在生成多个进程并挂起

您有

https://finance.google.com/?...&...&...

变成了

"https://finance.google.com/?...&...&..."