Answers:
如果单击View History
文章的链接,则可以看到对该文章所做的更改,在什么日期以及由谁进行的更改的列表。还将显示更改描述的简短摘要。然后,您可以单击Compare selected version
按钮比较文本。
不幸的是,我不了解Blame功能,该功能使您可以直接查看是谁更改了特定行,句子或段落。
编辑:您可能想查看Greg Hewill的网站,他(显然)正在开发这种怪功能。
使用http://wikipedia.ramselehof.de/wikiblame.php?lang=zh-CN,它允许在Wikipedia上搜索修订。
您可以通过单击"View History"
每个维基百科文章右上角的来完成此操作。在这里,您将找到文章的修订列表。如果要专门由每个用户提交,则可以单击"cur"
每个修订旁边的,维基百科将突出显示已更改的内容。
一种方法是导出文章历史记录,然后使用本地工具(如)处理修订git blame
。这可以使用脚本来完成。
要导出文章历史记录,请使用Special:Export
,特别是:https://en.wikipedia.org/w/index.php?title=Special:Export&history=1&action=submit&pages=Blinkenlights
。
要怪罪,首先将修订添加到临时git存储库(如Python 3所示):
import tempfile
import subprocess
with tempfile.TemporaryDirectory() as repo:
os.chdir(repo.name)
subprocess.check_call(['git', 'init'])
然后下载导出的历史记录XML,使用进行解析lxml.etree
,然后遍历修订版(xpath //revision
)。对于每个修订版,将文本写入文件(例如article.wiki
),阅读作者并运行
subprocess.check_call(['git', 'commit', '-a', '-m', 'blah', '--author=' + str(author)])
将所有修订版本添加到仓库后,运行git blame article.wiki
以查看每一行的作者。
注意:Special:Export
可能会限制导出的修订版本的数量,因此在历史悠久的页面中,您可能必须多次获取XML。