Questions tagged «wget»

GNU Wget是一个免费软件包,可使用HTTP,HTTPS和FTP(最广泛使用的Internet协议)检索文件。它是一种非交互式命令行工具,因此可以轻松地从脚本,Cron作业,不支持X Window System(X11)的终端等中调用它。


5
您如何将wget响应重定向到标准输出?
我有一个crontab是wgetSA PHP页面每五分钟(只运行一些PHP代码),我想请求发送到标准输出的输出,在发送正常的wget输出/dev/null(或者隐藏)。我在wget手册中找不到。 我正在寻找类似的东西: wget -o stdout http://whatever.com/page.php > /dev/null 有人知道吗
148 linux  wget  stdout 

5
重定向时如何获取具有正确名称的文件?
因此,经过一段时间的Google和超级用户搜索(以及扫描手册页)后,我无法找到答案(我认为应该很简单): 如果您去这里: http://www.vim.org/scripts/script.php?script_id=2340 并尝试下载主题: http://www.vim.org/scripts/download_script.php?src_id=9750 像这样: wget http://www.vim.org/scripts/download_script.php?src_id=9750 您可能最终得到一个名为的文件download_script.php?src_id=9750。 但是我希望将其称为molokai.vim,如果使用浏览器下载该文件,将会发生这种情况。 我需要为wget指定哪些选项以达到预期的效果? 我也可以使用Curl等效命令。

4
使用Wget保存单个网页(带有背景图片)
我想使用Wget保存单个网页(不是递归的,不是整个站点)以供参考。类似于Firefox的“完整网页”。 我的第一个问题是:我无法让Wget保存CSS中指定的背景图像。即使它确实保存了背景图像文件,我也不认为--convert-links会将CSS文件中的背景图像URL转换为指向本地保存的背景图像。Firefox也有同样的问题。 我的第二个问题是:如果页面上有我要保存的图像,这些图像托管在另一台服务器上(例如广告),这些图像将不包括在内。--span-hosts似乎无法通过下面的代码来解决该问题。 我正在使用: wget --no-parent --timestamping --convert-links --page-requisites --no-directories --no-host-directories -erobots=off http://domain.tld/webpage.html

6
如何使用wget命令下载保管箱文件?
似乎我只能使用chrome和firefox等资源管理器下载保管箱文件。如果我使用wget下载,则会得到html格式的文件。为什么? 例如,您可以打开此链接 https://www.dropbox.com/s/mx9eqve5l2ipgyk/test.txt >和资源管理器,但如果您使用 wget https://www.dropbox.com/s/mx9eqve5l2ipgyk/test.txt 您不会得到该文件的内容,为什么?以下是要下载的test.txt的一部分,这根本不是test.txt的内容。 那么可以使用wget而非资源管理器下载Dropbox文件吗? document.observe('script:loaded', function() { SharingModel.init('test\x2etxt', Util.from_json('\x7b\x22item\x5fid\x22\x3a\x20\x22\x22\x2c\x20\x22secure\x5fhash\x22\x3a\x20\x22\x22\x2c\x20\x22subpath\x22\x3a\x20\x22\x22\x2c\x20\x22tkey\x22\x3a\x20\x22mx9eqve5l2ipgyk\x22\x7d')) SharingModel.init_file() $('emsnippet-9911dfc627e1d541').innerHTML = 'test\x2etxt'.em_snippet(50, 0.750).escapeHTML(); $('emsnippet-add7879f5d805012').innerHTML = 'test\x2etxt'.em_snippet(20, 0.750).escapeHTML(); $('emsnippet-981ac0639529f983').innerHTML = 'test\x2etxt'.em_snippet(20, 0.750).escapeHTML(); FilePreview.init_text('https\x3a\x2f\x2fdl\x2edropbox\x2ecom\x2fs\x2fmx9eqve5l2ipgyk\x2ftest\x2etxt', 0) }); } else if (window.jQuery) { jQuery(function () { SharingModel.init('test\x2etxt', Util.from_json('\x7b\x22item\x5fid\x22\x3a\x20\x22\x22\x2c\x20\x22secure\x5fhash\x22\x3a\x20\x22\x22\x2c\x20\x22subpath\x22\x3a\x20\x22\x22\x2c\x20\x22tkey\x22\x3a\x20\x22mx9eqve5l2ipgyk\x22\x7d')) SharingModel.init_file() $('emsnippet-9911dfc627e1d541').innerHTML = 'test\x2etxt'.em_snippet(50, 0.750).escapeHTML(); $('emsnippet-add7879f5d805012').innerHTML = 'test\x2etxt'.em_snippet(20, 0.750).escapeHTML(); $('emsnippet-981ac0639529f983').innerHTML = …


15
如何在使用重定向的下载站点上找到真实的下载URL
假设我要使用进行下载,wget但是拥有我需要的文件的网站将重定向到一个站点,该站点会自动为我选择一个镜像(并且没有提供静态文件URL)。 从此类站点下载可在Firefox中使用,但是如何获得真实的 URL(不仅是重定向页面的链接),以便可以使用这些文件下载这些文件wget?



2
如何正确设置wget仅下载新文件?
假设有一个网址,我们称之为 http://www.some-url.com/folder/ 此位置已启用目录列表,因此我可以这样做: wget -r -np http://www.some-url.com/folder/ 要下载所有内容以及所有文件和子文件夹及其文件。 现在,如果我想在一个月后再次重复此过程,又不想再次下载所有内容,而只添加新文件/更改过的文件,该怎么办?
39 linux  terminal  wget 


7
如何使wget重命名下载的文件以不包含查询字符串?
我正在下载一个带有wget的网站,并且许多链接都附加了查询,因此,当我这样做时: wget -nv -c -r -H -A mp3 -nd http://url.to.old.podcasts.com/ 我最终得到了很多这样的文件: 1.mp3?foo=bar 2.mp3?blatz=pow 3.mp3?fizz=buzz 我想结束的是: 1.mp3 2.mp3 3.mp3 这都是在ubuntu linux中进行的,我有wget 1.10.2。 我知道我可以通过脚本获得所有内容以重命名所有内容后执行此操作。但是我真的很想从wget中获取解决方案,以便在下载过程中可以看到正确的名称。 谁能帮我解决这个问题?
32 http  rename  wget  podcasts 


1
如果未指定-k,则让wget在下载后将HTML链接转换为相对链接
该-k选项(或--convert-link)将下载完成后,如该男子页说后转换链接在网页中相对: 下载完成后,请转换文档中的链接以使其适合本地查看。这不仅会影响可见的超链接,还会影响文档中链接到外部内容的任何部分,例如嵌入的图像,样式表的链接,非HTML内容的超链接等。 因此,如果我未指定-k,wget下载后是否可以再次运行并修复该问题,如果是的话,正确的命令是什么?我的猜测是wget -c [previous options used] [url]在文件下载到的同一工作目录中运行它。
32 wget 

3
如何重试与wget的连接?
我的互联网连接非常不稳定,有时必须下载最大200 MB的文件。 问题是速度经常下降并停滞不前,--, -K/s并且该过程仍然有效。我以为只是向过程发送一些KILL信号,但是正如我在wget手册中阅读有关信号的信息一样,它没有帮助。 wget在连接断开并再次恢复后,如何强制自身重新初始化并从中断的地方继续下载? 我想保持wget运行状态,当我回来时,我希望看到它正在下载,而不是急于等待--,-K/s。
29 linux  wget 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.