我的意思是在指定的时间段和间隔内从Wayback Machine下载可用的每个页面。例如,我想从2012年1月到2012年12月每天从nature.com下载可用的每个页面。(这不完全是我想要做的,但是已经足够接近了-并提供了一个很好的示例。)
不幸的是,由于Wayback机器的独特工作原理,wget无法正常工作。
似乎Wayback Machine下载器之类的工具只能下载该页面的最新版本。
与IA API进行交互似乎是一条可行的路线,但是我不确定这将如何工作。
谢谢!
您肯定需要为此编写脚本。也许cURL?
—
PulseJet '17
我认为可以编写脚本并依靠cURL,但是我不熟悉Internet档案库使用的Memento API,并且不认为我以这种方式使用过。
—
奥兰多·马里内拉(Marlandella)
我需要a)一次执行多个站点,b)在很长的间隔(例如1998到2001)中获取每个站点的快照,并且c)能够指定在该间隔内要拍摄多少个快照。
—
奥兰多·马里内拉
同样的问题。他们似乎只需要一页,看来WB Machine下载器的文档是否在这样的间隔内有效。
—
奥兰多·马里内拉(Marlandella)