有httrack备份站点吗?


1

我试图用httrack备份一个网站,但它没有做我想要的。

它已经持续了20分钟,并从其他网站下载看似无意义的图像和js文件。我链接的页面是“存档”页面,其中包含指向我想要的所有页面的链接。当我浏览到该文件夹​​并启动备份html文件。我看到该页面,但所有链接都是指向原始网站的直接链接。它似乎没有保存它链接到的页面。(过去20分钟它一直在做什么......)

如何告诉httrack进入特定页面并备份该页面链接到该域的所有页面?


你的意思是HTTrack(httrack.com)?
威廉杰克逊

我从来没有遇到过默认设置的问题。您可以将URL发布到您要备份的网站吗?
威廉杰克逊

@William:我尝试抓取这个特定页面2pstart.com/comic-archives它没有尝试获取它链接的页面(在同一个域中)。它存储了这个特定的页面,直接链接到漫画,并在我停止之前从www.widgetbox.com下载超过40mb。这是扫描时间> 1小时。

他们的目录已打开,所以我可以获得漫画。我现在只想要每个2pstart.com/comics的文本我可能在一小时内为文本写一个机器人,但页面看起来不会很酷或相同
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.