Questions tagged «httrack»

6
使用wget或httrack镜像已归档网站时遇到问题
我正在尝试使用wget创建网站的本地镜像。但是我发现我没有得到所有的链接页面。 这是网站 http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/ 我不想所有的开头的页面web.archive.org,但我确实希望所有的开头的页面http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/。 当我使用时wget -r,在文件结构中我发现 web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/index.html, 但我没有该数据库中的所有文件,例如 web.archive.org/web/20110808041151/http://cst-www.nrl.navy.mil/lattice/struk/d0c.html. 也许httrack会做得更好,但是现在这太抢手了。 因此,通过哪种方法可以从Internet Archive Wayback Machine上获取已存档网站的本地副本?

0
有httrack备份站点吗?
我试图用httrack备份一个网站,但它没有做我想要的。 它已经持续了20分钟,并从其他网站下载看似无意义的图像和js文件。我链接的页面是“存档”页面,其中包含指向我想要的所有页面的链接。当我浏览到该文件夹​​并启动备份html文件。我看到该页面,但所有链接都是指向原始网站的直接链接。它似乎没有保存它链接到的页面。(过去20分钟它一直在做什么......) 如何告诉httrack进入特定页面并备份该页面链接到该域的所有页面?

1
有什么比httrack下载文件更好的东西?
我正在尝试从具有javascript和框架的网页上下载文档(pdf,tiff,图像)。例如:http://127.0.0.1/web/guest/en/websys/webArch/mainFrame.cgi “ httrack --get-files”没有下载任何内容,您还有其他想法吗?另一个程序?我需要自己编写该程序吗? 非常感谢!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.