我正在尝试下载两个站点以包含在CD中:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
我遇到的问题是这些都是Wiki。所以当用例如下载时:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
我确实得到了很多文件,因为它也跟随着诸如...?action = edit ...?action = diff&version = ...之类的链接
有人知道解决这个问题的方法吗?
我只想要当前页面,没有图像,没有差异等。
PS:
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
这为伯克利工作,但boinc-wiki.info仍然给我带来麻烦:/
PPS:
我得到了与以下内容最相关的页面:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info
无需超级用户和serverfault之间交叉后serverfault.com/questions/156045/...
—
布莱恩
我应该在哪里发布它?
—
并列战士
就是这儿。这不是服务器问题。
—
David Z 2010年
我还是在serverfault上得到了更好的答案;)
—
Tie-fighter 2010年