如何解决丢失的“最后修改”标题的问题?


13

我正在这样运行wget

wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main

我收到了很多这样的消息:

Last-modified header missing -- time-stamps turned off.

我想这意味着即使我在本地也可以重新下载页面。

注意:我想要这样做,这样我每次运行命令镜像时都不必重新下载现有文件。


您是网页的所有者吗(如果它确实是tshepang.net)。如果是这样,Web服务器是否为apache,您可以对其配置进行任何控制吗?还是至少启用了.htaccess并允许选项覆盖?
forcefsck

@forcefsck:不,该网站由Posterous运行。他们有一个用于阅读所有帖子的API,但这对我来说是这些网络技术的学习曲线。
tshepang 2011年

Answers:


10

您是否尝试添加-c参数?

wget手册摘录:

-c-继续

从Wget 1.7开始,如果在非空文件上使用-c,并且事实证明服务器不支持继续下载,则Wget将拒绝从头开始下载,这将有效破坏现有内容。如果您确实希望下载从头开始,请删除该文件。

同样从Wget 1.7开始,如果在与服务器上大小相同的文件上使用-c,Wget将拒绝下载该文件并打印一条说明性消息。当服务器上的文件小于本地文件时(可能是因为自从上次尝试下载以来,文件已在服务器上更改),也会发生同样的事情-因为“继续”没有意义,因此不会进行下载。

另一方面,在使用-c时,服务器上大于本地的任何文件都将被视为不完整的下载,并且仅下载“(length(remote)-length(local))”字节并将其添加到本地文件的末尾。在某些情况下,这种行为可能是理想的-例如,您可以使用wget -c仅下载已附加到数据收集或日志文件中的新部分。

据我所知,它应该跳过已经下载且大小相同的文件。


如果文件较小怎么办?
CJ7
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.