Wget - 排除域和目录的难度


2

我在Windows 7中使用Wget。我相信这限制了我对Wget 1.11.4。

对于任何对细节感兴趣的人,我发布了一个示例wgetrc文件。这个样本实际上是我目前正在使用的样本。我的Wget命令如下:

wget 2> "I:\Current\Wget\wgeterr.log"

我遇到了应该限制下载内容的选项的问题。正如wgetrc(上文)末尾所详述的那样,某些形式的限制似乎不起作用。

特别是,我认为我使用exclude_domains正确地指出我不想在下载中包含twitter.com,作为与我正在下载的网站相同级别的文件夹(即,raywoodcockbio.wordpress.com) 。然而,我正在获得twitter.com。

问题是,如何防止twitter.com(也包括Facebook和其他社交媒体网站文件夹)被包含在我的下载中?

Answers:


0

看参数exclude_directories-Xwget的。该-X选项指定是从下载排除的目录列表。例如,如果您不希望Wget/foo-bar目录下载内容,请-X /foo-bar在命令行中指定。


1
出于某种原因,无论我是否指定排除例如twitter.com或/twitter.com,都无法阻止twitter.com和www.facebook.com的创建。twitter.com文件夹在顶层创建,即与所需的下载文件夹在同一目录级别。如果我在wgetrc中使用exclude_directories指定twitter.com或/twitter.com,它也会失败。
Ray Woodcock 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.