我曾经wget --mirror --html-extension --convert-links
用来镜像站点,但最终得到了许多格式的文件名post.php?id=#.html
。当我尝试在浏览器中查看这些内容时,它会失败,因为浏览器在加载文件时会忽略查询字符串。是否可以用其他方法替换?
文件名中的字符?
--restrict-file-names=windows
正确工作的答案。与标志--convert-links
和--adjust-extension
/ -E
(以前称为--html-extension
,但也可以使用,但已弃用)结合使用,将生成一个运行正常的镜像。
wget --mirror --adjust-extension --convert-links --restrict-file-names=windows http://www.example
http://site.com/article.cgi?25
地保存类似URL的信息,article.cgi?25.html
请参见2.7节,位于gnu.org/software/wget/manual/wget.html#HTTP-Options