如何浏览使用wayback_machine_downloader下载的网站?


-1

我在上面阅读了讨论 如何从archive.org Wayback Machine下载网站? 并按照说明进行操作 https://github.com/hartator/wayback-machine-downloader 安装wayback_machine_downloader并用它成功从archive.org下载网站。

有没有办法浏览这些页面,以便点击链接会带您到相应的离线页面,而不是尝试在线打开实时页面?


尝试一下 的HTTrack 工具。它很棒,并且它自己生成相对的本地URL。
C0deDaedalus

Answers:


0

如果您使用的程序没有自动为您重写URL,您可以说有两个基本选项......

第一个选项是创建一个镜像您下载的内容的个人服务器。您将设置一个Web服务器,如 阿帕奇 要么 Nginx的 (要么 另一种选择 )在您的本地PC上,然后创建至少一个相应的 虚拟主机 对于过时的域名。该主机(或多个主机)将容纳您下载的文件。你需要某种形式的 DNS 解决方案将旧域映射到本地Web服务器,但这可能是您的 主机文件 甚至是完整的本地DNS设置 BIND 要么 类似的软件

如果上述解决方案不合适,您可能会自行重写URL。您当然可以手动执行此操作,但(根据项目的大小)您可能需要查看 蟒蛇 脚本语言和一个名为的模块 美丽的汤 。美丽的汤用于解析网页,并可能重写链接(假设您编写脚本来执行此操作)。

作为一个小警告,无论您选择哪种方法,您仍可能需要查看HTML源代码以确定哪些链接需要注意哪些链接需要注意。记住外部链接可能无法正常工作也是有帮助的,假设archive.org也没有制作该内容的副本。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.