使用Web浏览器(IE或Chrome),我可以使用Ctl-S保存网页(.html),使用任何文本编辑器进行检查,并查看表格格式的数据。我想提取这些数字之一,但是对于许多许多网页而言,太多的事情无法手动完成。因此,我想使用WGET逐个获取这些网页,并编写另一个程序来解析.html并检索所需的编号。但是,使用与浏览器相同的URL时WGET保存的.html文件不包含数据表。为什么不?好像服务器检测到该请求来自WGET而不是来自Web浏览器,并提供缺少数据表的框架网页。如何使用WGET获得完全相同的网页?- 谢谢!
更多信息:
我尝试获取的URL的示例是:http : //performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US,其中字符串ICENX是共同基金的代号,我将更改为许多不同的股票代号。在浏览器中查看时,这将下载数据表,但是如果使用WGET提取数据表,则会丢失该数据表。