通常,我需要下载一个网页,然后离线对其进行编辑。我尝试了一些工具,它们缺少的主要功能是下载CSS文件中引用的图像。
是否有一个工具(用于Linux)可以下载所有内容,以便该网页可以离线呈现相同内容(不包括AJAX)?
通常,我需要下载一个网页,然后离线对其进行编辑。我尝试了一些工具,它们缺少的主要功能是下载CSS文件中引用的图像。
是否有一个工具(用于Linux)可以下载所有内容,以便该网页可以离线呈现相同内容(不包括AJAX)?
--html-extension
从v1.12开始不推荐使用。我建议这样做:wget -U "Opera 11.0" --page-requisites --content-on-error --no-clobber --convert-links --restrict-file-names=windows --no-parent "http://stackoverflow.com"
将url放在双引号中非常重要,否则它将被卡住Redirecting output to ‘wget-log’.
。
Answers:
wget --page-requisites http://example.com/your/page.html
此选项使Wget下载正确显示给定html页面所需的所有文件。这包括内联图像,声音和引用的样式表。
编辑:没错,股票wget不会解析和下载CSS图像。然而,有,,增加了该功能的补丁:[ 1,2 ]
更新:上述补丁已合并到wget 1.12中,于2009年9月22日发布:
** Added support for CSS. This includes:
- Parsing links from CSS files, and from CSS content found in HTML
style tags and attributes.
- Supporting conversion of links found within CSS content, when
--convert-links is specified.
- Ensuring that CSS files end in the ".css" filename extension,
when --convert-links is specified.
@import
语法链接的CSS文件。
curl
无法下载整个网页,因为它无法解析HTML:ec.haxx.se/usingcurl-downloads.html#client-differences
可以通过Firefox进行此操作,请参见此表单
参考-http: //www.webdeveloper.com/forum/showthread.php?t=212610
wget对您来说是一个不错的选择。只是为了获得更多信息,目前Windows上的wget版本目前尚未在gnu上正式发布wget版本1.12。当前版本是1.11
wget版本1.11无法下载css文件中的图像/字体。幸运的是,您可以从此页面找到1.14的内部版本。它解决了这些问题。
http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html
1.12
当前版本的Opera(12)允许将页面另存为“带有图像的HTML”。
因此,Opera还可以下载CSS文件中引用的图像,并相应地调整CSS中的图像URL。
wget