有没有一种便携式方法可以下载或缓存网站的所有页面以供离线查看?明天我要进行越野飞行,我希望能够缓存一些网页(尤其是python doc页面(http://docs.python.org/)和pyqt参考(http:// www。 riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html)。
理想情况下,我需要Firefox插件或类似的插件,但是只要可以在Linux上运行,一切都可以正常工作。
有没有一种便携式方法可以下载或缓存网站的所有页面以供离线查看?明天我要进行越野飞行,我希望能够缓存一些网页(尤其是python doc页面(http://docs.python.org/)和pyqt参考(http:// www。 riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html)。
理想情况下,我需要Firefox插件或类似的插件,但是只要可以在Linux上运行,一切都可以正常工作。
Answers:
我使用HTTrack。
它允许您将Internet上的万维网站点下载到本地目录,以递归方式构建所有目录,并将HTML,图像和其他文件从服务器获取到计算机。
我将wget与这些选项结合使用以镜像站点以供离线使用
wget -cmkE -np http://example.com/a/section/i/like
哪里
-m打开用于本地镜像站点的镜像选项
-c如果我已经下载了某些页面,则继续上一次下载
-k将绝对href转换为指向本地href,以供离线查看
-E确保下载后文件的扩展名为.html。
-np仅下载/ a / section / i /下的对象,而不缓存整个站点。
例如,我想下载南方文件,而不是南方门票,等等。
wget -cmkE -np http://south.aeracode.org/docs/index.html
我使用Windows并在cygwin上运行wget,但是还有一个本机Windows wget端口。
尽管您可以从python docs部分下载python离线文档
尝试使用http://www.downthemall.net/ Firefox插件。我用它来下载了20多个单独文件中的250页PDF。它非常强大。它具有通配符/查询语法,可让您通过手术方式仅获取所需的文件,而不会获取不相关的文件。
我知道的一些Firefox扩展:
帮助您保存网页并轻松管理集合。主要功能包括轻巧,速度,准确性和多语言支持。主要特点是:
- 保存网页
- 保存网页摘要
- 保存网站
- 以与书签相同的方式组织收藏集
- 全文搜索和集合的快速筛选搜索
- 编辑收集的网页
- 文本/ HTML编辑功能类似于Opera的注释
ScrapBook Plus和ScrapBook之间的区别:
- 更快的排序
- 更快的进出口
- 打开窗口直接从侧边栏管理您的收藏
- 简化了“合并向导”的处理
- “捕获多个URL”的新功能(过滤器以排除链接,使用网站标题或链接标题作为侧边栏中条目的新标题,指定下载之间的等待时间为0到3秒,使用UTF-8或ISO-8859-1作为字符集)
- 新的“捕获”窗口(需要手动启动下载,关闭自动滚动)
- 编辑器中的6个荧光笔
允许您查看MHT(MHTML)Web存档格式文件,并将完整的网页(包括文本和图形)保存到单个MHT文件中
Pocket(不是扩展程序;内置的Firefox功能)
使您只需单击一下即可将网页和视频保存到Pocket。Pocket可以消除混乱情况,并将页面保存在干净,无干扰的视图中,并让您可以通过Pocket应用程序随时访问它们。
注意:
在Firefox上保存并访问您的Pocket列表需要Internet连接。使用Pocket应用程序可以在其他设备上进行离线查看。
您可以使用wget下载整个网站或网站的一部分。
wget -r http://docs.python.org/
查看wget手册,了解您可能希望通过的其他选项,例如,限制带宽使用,控制递归深度,设置排除列表等。
脱机浏览的另一种方法是使用缓存代理。Wwwoffle具有很多功能,可促进保留脱机浏览,例如,覆盖服务器指定的到期日期和递归预取功能。(自拨号以来,我一直在使用wwwoffle。)