网站下载器（缓存？）以离线查看网站

9

有没有一种便携式方法可以下载或缓存网站的所有页面以供离线查看？明天我要进行越野飞行，我希望能够缓存一些网页（尤其是python doc页面（http://docs.python.org/）和pyqt参考（http：// www。 riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html）。

理想情况下，我需要Firefox插件或类似的插件，但是只要可以在Linux上运行，一切都可以正常工作。

firefox website plugins

— 法尔玛里
source

您可以尝试使用此脱机网站下载器。

— Menelaos Vergis 2014年

15

我使用HTTrack。

它允许您将Internet上的万维网站点下载到本地目录，以递归方式构建所有目录，并将HTML，图像和其他文件从服务器获取到计算机。

— 埃德加
source

我过去曾经使用过这个不错的免费解决方案。

— MaQleod

1

HTTrack是适用于Linux和Windows的最佳软件，并且有大量的选项可配置下载过程。.我喜欢

— eslambasha

我也用过他们现在也提供了Android版本。

— gparyani 2014年

-1它不构建“所有目录”，也不构建所有“图像和其他文件”。它仅获得链接的内容。

— barlop

6

我将wget与这些选项结合使用以镜像站点以供离线使用

wget -cmkE -np http://example.com/a/section/i/like

哪里

-m打开用于本地镜像站点的镜像选项

-c如果我已经下载了某些页面，则继续上一次下载

-k将绝对href转换为指向本地href，以供离线查看

-E确保下载后文件的扩展名为.html。

-np仅下载/ a / section / i /下的对象，而不缓存整个站点。

例如，我想下载南方文件，而不是南方门票，等等。

wget -cmkE -np http://south.aeracode.org/docs/index.html

我使用Windows并在cygwin上运行wget，但是还有一个本机Windows wget端口。

尽管您可以从python docs部分下载python离线文档

— 梅瑟姆
source

1

尝试使用http://www.downthemall.net/ Firefox插件。我用它来下载了20多个单独文件中的250页PDF。它非常强大。它具有通配符/查询语法，可让您通过手术方式仅获取所需的文件，而不会获取不相关的文件。

— 罗尼克
source

1

我知道的一些Firefox扩展：

— 银河忍者
source

0

您可以使用wget下载整个网站或网站的一部分。

wget -r http://docs.python.org/

查看wget手册，了解您可能希望通过的其他选项，例如，限制带宽使用，控制递归深度，设置排除列表等。

脱机浏览的另一种方法是使用缓存代理。Wwwoffle具有很多功能，可促进保留脱机浏览，例如，覆盖服务器指定的到期日期和递归预取功能。（自拨号以来，我一直在使用wwwoffle。）

— 吉勒斯“别再邪恶了”
source