Answers:
我喜欢使用--page-requisites
(-p
简称)而不是-r
这里,因为它会下载页面需要显示的所有内容,而不会下载其他页面,而且我也不必考虑我想要哪种文件。
其实我通常使用类似
wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
这表示:
-E
:.html
如果文件名是HTML文件,但没有结尾.html
或类似名称,则追加到文件名-H
:也从其他主机下载文件-k
:下载后,转换其中的任何链接,以便它们指向下载的文件-p
:下载页面所需的任何内容以进行适当的离线查看-H
,并很高兴地了解-E
和-k
太。谢谢!
我认为该命令可以帮助您入门。
wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
它允许您指定保存图像的位置以及所需的文件类型。这样下载图像可能会更容易。
资料来源:
-r启用递归检索。有关更多信息,请参见递归下载。
-P设置所有文件和目录保存到的目录前缀。
-A设置白名单以仅检索某些文件类型。字符串和模式都可以接受,并且都可以在逗号分隔的列表中使用(如上所示)。有关更多信息,请参见文件类型。
我注意到该网站使用PNG图片文件。您可以只从文件夹中复制它们。这应该在您存储网页的文件夹中运行。
find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
Wget只是下载页面的HTML文件,而不下载页面中的图像,因为页面HTML文件中的图像被写为URL。要执行所需的操作,请使用-R
(递归),-A
带有图像文件后缀的--no-parent
选项,使该选项不升序的--level
选项以及带有的选项1
。
特别 wget -R -A .jpg,.png,.gif --no-parent --level <url>
更好的是,大多数浏览器都有保存页面以供离线查看的方法。