我使用wget下载html文件,文件中的图像存储在哪里?


15

Firefox的加载速度非常慢,因此我决定使用wget保存HTML文件。我使用了以下命令,

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

这些文件已保存在我的主文件夹中。但是我不知道图像的存储位置。我需要在中使用它们Anki

那么图像存储在哪里?


本文介绍了这些选项及其用法。
2014年

Answers:


34

我喜欢使用--page-requisites-p简称)而不是-r这里,因为它会下载页面需要显示的所有内容,而不会下载其他页面,而且我也不必考虑我想要哪种文件。

其实我通常使用类似

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

这表示:

  • -E.html如果文件名是HTML文件,但没有结尾.html或类似名称,则追加到文件名
  • -H:也从其他主机下载文件
  • -k:下载后,转换其中的任何链接,以便它们指向下载的文件
  • -p:下载页面所需的任何内容以进行适当的离线查看

我来到这里寻找-H,并很高兴地了解-E-k太。谢谢!
查尔斯·克莱顿

2

使用-r参数应该使wget能够下载整个文件夹,包括图像。

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

也分别下载图像文件

我认为该命令可以帮助您入门。

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

它允许您指定保存图像的位置以及所需的文件类型。这样下载图像可能会更容易。

资料来源

-r启用递归检索。有关更多信息,请参见递归下载。

-P设置所有文件和目录保存到的目录前缀。

-A设置白名单以仅检索某些文件类型。字符串和模式都可以接受,并且都可以在逗号分隔的列表中使用(如上所示)。有关更多信息,请参见文件类型。

从文件夹中复制图像文件

我注意到该网站使用PNG图片文件。您可以只从文件夹中复制它们。这应该在您存储网页的文件夹中运行。

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

Wget只是下载页面的HTML文件,而不下载页面中的图像,因为页面HTML文件中的图像被写为URL。要执行所需的操作,请使用-R(递归),-A带有图像文件后缀的--no-parent选项,使该选项不升序的--level选项以及带有的选项1

特别 wget -R -A .jpg,.png,.gif --no-parent --level <url>

更好的是,大多数浏览器都有保存页面以供离线查看的方法

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.