我想使用cron每天下载一次投资组合信息,增加了两个复杂性:
如果我使用:
wget -U Chromium --user='e-address' --password='pass' \
https://www.google.com/finance/portfolio > "file_"`date +"%d-%m-%Y"`+.csv
我得到的答复是:
=========================================================================
--2013-10-20 12:16:13-- https://www.google.com/finance/portfolio
Resolving www.google.com (www.google.com)... 74.125.195.105, 74.125.195.103, 74.125.195.99, ...
Connecting to www.google.com (www.google.com)|74.125.195.105|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘portfolio’
[ <=> ] 16,718 --.-K/s in 0.04s
2013-10-20 12:16:13 (431 KB/s) - ‘portfolio’ saved [16718]
==========================================================================
它保存到一个名为“公文包”的文件中,而不是我要求它保存的位置(“文件”日期“%d-%m-%Y”
.csv)。当我在浏览器中查看“公文包”时,它说我需要登录我的帐户,即不注意我包含的用户和密码信息。
如果我将鼠标悬停在“下载到电子表格”链接上得到的字符串添加到网址:-
wget -U Chromium --user='e-address' --password='pass' \
https://www.google.com/finance/portfolio?... > "file_"`date +"%d-%m-%Y"`+.csv
我得到:
[1] 5175
[2] 5176
[3] 5177
[4] 5178
--2013-10-20 12:44:56-- https://www.google.com/finance/portfolio?pid=1
Resolving www.google.com (www.google.com)... [2] Done output=csv
[3]- Done action=view
[4]+ Done pview=pview
hg21@hg21-sda2:~$ 74.125.195.106, 74.125.195.103, 74.125.195.104, ...
Connecting to www.google.com (www.google.com)|74.125.195.106|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘portfolio?pid=1’
[ <=> ] 16,768 --.-K/s in 0.05s
2013-10-20 12:44:56 (357 KB/s) - ‘portfolio?pid=1.1’ saved [16768]
在这一点上,它挂着。它在此时写入的文件('投资组合?Pid=1')与之前使用的wget的'投资组合'文件相同。
如果我输入密码,它将继续:
pass: command not found
[1]+ Done wget -U Chromium --user="e-address" --password='pass' https://www.google.com/finance/portfolio?pid=1
[1]+ Done wget -U Chromium --user="e-address" --password='pass' https://www.google.com/finance/portfolio?pid=1
非常感谢您的帮助。
这里有几个问题:
1) wget
未保存到正确的文件名
使用-O
选项代替
更改<代码>
提示:如果使用日期“%Y-%m-%d”
,文件将按时间顺序自然排序。
这本质上是wget命令的重复,用于下载文件并保存为不同的文件名
有关选项,请参见man wget
。
2)wget
正在生成多个进程并挂起
您有
https://finance.google.com/?...&...&...
变成了
"https://finance.google.com/?...&...&..."