没有引文部分“ [1]”,“ [2]”,“ [3]”的情况下,我们如何从Wikipedia复制文本?


10

如果我们从Wikipedia页面复制文本,那么大致就是这样:

句子间距是排版文本中句子之间的水平间距。这是印刷约定的问题。[1]自从欧洲引入可移动式印刷以来,在带有拉丁字母的语言中已使用了各种句子间距约定。[2]这些包括正常的单词空间(在句子中的单词之间),单个扩大的空间,两个完整的空间,以及最近在数字媒体中没有的空间。[3]尽管现代数字字体可以自动调整单个单词的空间,以在终端标点后创建视觉上令人愉悦的一致间距,[4]但 大多数争论是关于在句子之间敲击键盘的空格键一次还是两次。[5]

我不希望将部分复制[1][2]等,这实际上是我想要的东西复制:

句子间距是排版文本中句子之间的水平间距。这是印刷约定的问题。自从欧洲引入可移动式打印以来,在带有拉丁字母的语言中已使用了各种句子间距约定。这些包括正常的单词空间(在句子中的单词之间),单个扩大的空间,两个完整的空间,以及最近在数字媒体中没有的空间。尽管现代的数字字体可以自动调整单个单词的空间,以在终端标点后创建视觉上令人愉悦的一致间距,但是大多数争论是关于在句子之间敲击键盘的空格键一次还是两次。

下面选择的答案使用正则表达式,但并非每次都有效。(如果实际文本本身包含[并且]正则表达式不应删除它们。)

有更好的解决方案吗?


这些参考可能很重要,因为它们通常支持所显示信息的可信性。包括参考文献是有帮助的,特别是对研究人员而言。
兰道夫·理查森

@Randolf包括参考文献可能会有所帮助,特别是对于研究人员而言。不适合只需要信息的
正常人

您的文字处理器的搜索和替换功能(可能从宏调用)在这里可能会派上用场。
基思

顺便说一句,我确实赞成你的问题,因为我确实认为这是一个好问题。关于推荐人,很多人希望看到他们,特别是大学教授(如果您打算参加其中,几乎可以肯定的是,大多数教授都希望您所写的任何研究论文都包含推荐人,而且您可能会听到其他学生不时谈论参考资料)。
兰道夫·理查森

@Randolf我的意思是我只想存储信息以供个人将来阅读和使用。
Pacerier,2011年

Answers:


10

小书签是您的朋友...

创建一个新的浏览器书签并将下面的javascript代码复制到其中-当您想从Wikipedia复制一些文本时,只需事先单击它,它将删除[n]的所有实例,以满足您在问题中的要求。

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

在幕后,它只是在进行正则表达式搜索并替换<sup>...</sup>页面上的所有HTML标签。

我刚刚在IE7中进行了尝试,并且效果很好,因此希望在其他浏览器中也可以。

我会向SO指出正确的方向,这是我的功劳-我知道小书签是要走的路,但以前从未写过。


1
+1,这是我想到的唯一方法。甚至其他浏览器扩展也必须使用某种Javascript分析来执行此操作(实际上大多数人都这样做)。
突破
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.