无法从pdf文件复制文本


40

我正在使用foxit PDF阅读器来查看我的课本。我想将pdf文件中的文本复制到word文档中,但不会让我这样做。我可以选择合适的文本,但是复制文本的选项不可用。我可以复制其他文档中的文本,但不能复制某些文档中的文本。有没有一种方法可以解决Windows中的这种保护问题?


我发现我的答案对您不起作用,因此您发布了一笔赏金。如果您在某处张贴此类pdf的示例,我将进行介绍。
harrymc

@harrymc:具体来说,我想复制的表的值是acousticslab.org/papers/VassilakisP2001Dissertation.pdf
endolith,2012年

@endolith:看到我的新答案。
harrymc

Answers:


29

pdf文件可能已被锁定,无法复制文本。以下是两种解锁方法:

  1. 如果尚未锁定PDF以防止打印,则可以将其打印到虚拟pdf打印机上以创建未锁定的文件。请参见:
    “删除密码并解锁允许在不知道秘密的情况下进行打印的受保护PDF”
  2. 如果打印功能已被锁定,请参阅以下内容:
    “使用PDF解锁程序删除限制并解密受密码保护的PDF文件”

您可以查看PDF是否已锁定以进行复制。从“文件”菜单中选择“属性”,然后在“安全性”选项卡上说是否允许“内容复制”。
Rob Sedgwick

尝试打印PDF。打印的文件不允许选择文本,因为它似乎将文本转换为图像。
queezz

@queezz:PDF必须包含开始的图像。
harrymc

@harrymc是的,有图像。但是,文本也会转换为图像。Google Chrome选项在同一文档上效果很好。
queezz

您的第一个链接链接到primopdf.com/installers/4.0.1/FreewarePrimo64Setup.exe ,这很糟糕,它不起作用,而且您似乎也从未将其存档到archive.org。您的第二个链接还可以,但是它链接到文件共享站点dfiles.eu/files/7kiqyvswk ,但该文件还可以,并进行了病毒总计检查。但并不是那么容易找到,因为mydigitallife页面上有各种链接。它在此处表示“ PDF Unlocker是一个免费但用户友好的工具,可以通过此处的链接下载(当前版本1.0.4)。”
barlop

25
  1. 在Google Chrome浏览器中打开PDF(将PDF文件拖放到Chrome)。
  2. 将特定页面打印为PDF或仅打开打印预览。
  3. 现在,您可以从打印预览中复制文本或输出PDF。但是我认为您不能直接复制该表。


4
这对我也有效。这是我在这里看到的最简单的方法。
endolith'7

3
绝对辉煌​​。哦,顺便说一下,您可以将文件拖到Chrome的标签栏中以快速打开它们。
iono

在Chrome 53中,这两种方法都不对我有用。漏洞是否可能被消除了?
西蒙东

11

我能够使用Ghostscript(适用于Windows)创建PDF文件的无DRM版本。

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

stripped.pdf可以将生成的文件加载到Adobe Reader中,并且Reader将很高兴地允许您复制所需的任何部分。它还保留了表的大多数格式。


太好了 我的税务会计师拒绝提供非DRM PDF文件,也​​拒绝提供删除DRM的密码。这解决了我的问题。优秀作品!
kevinarpe13年

如果PDF有密码,请确保包括-sPDFPassword开关(-sPDFPassword=password)。
palswim

2

我能够使用Okular(对于Linux; KDE的一部分)成功地从PDF文件中复制表格。为此,我必须进入Okular的设置,然后取消选中“ Obey DRM限制”。

我知道自从运行Windows以来,这并不能真正帮到您,但是如果您手持Linux机器或愿意安装它,则有可能。

不幸的是,它是纯文本,没有格式,但是看起来重新创建表应该不难。您可以在此处查看我的复制和粘贴冒险的结果


这就是VirtualBox的用途。:DI还可以复制纯文本而无需格式化,但是一次选择一列很容易导出。
endolith'7

看起来这最适合数字表,因为Okular允许您对文本进行矩形选择并按顺序提取单个列。
endolith'7

对于单列,可能是这样。对于整个表格,请参阅我的其他答案
迈克尔·汉普顿

请注意,Okular 可以在Windows上运行。实际上,许多 KDE软件都可以在Windows上运行
Bakuriu 2013年

1

您可以使用GT Text是将图像(也称为pdf快照=图像)转换为文本的程序。您可以选择区域并将其复制到剪贴板。这是免费的

官方主页是 http://gttext.googlecode.com


1

如果复印件变灰(现在怀疑是针对您的),则说明PDF已被“锁定”,可以读取,但实际上阻止了您从复印件中粘贴/粘贴任何内容。

该网站将解锁PDF

https://smallpdf.com/unlock-pdf


0

如果您只是在寻找简短的摘录,则通常可以在Google引号内输入一些单词,然后找到已经以其他格式扫描或由其他人键入的确切报价。

另一个选项是Google Docs Android应用程序中的“来自照片的文档”,它将通过OCR放置文本。当然,这容易出错。

我希望PDF锁​​定功能永远不存在。:(


0

回答内含物:

您的PDF可以防止复制,但不能防止打印。

因此,我已将包含表6.15的一页打印到另一个不受复制保护的PDF中,选择并复制了该表,然后将其粘贴到Word中。令我惊讶的是,糊的结果是完全的垃圾。

现在,我进一步看了这张桌子,发现了一个非常令人惊讶的结果: 这不是一张桌子!

实际上,它是一小段文字的蒙太奇,位于页面上,看起来像表格。但这不是一个真正的表。

最好的办法是将整个内容重写为表格,或者仅在工作中使用此表格状组合文本的屏幕快照。

这是我的表格屏幕截图,取自我生成的一页pdf文档

图片


我试图用2个程序打印它,但我得到的只是空白页。
endlith 2012年

使用Foxit Reader,我将自己放在页面上,然后将当前页面打印到pdf打印机(我使用Cute Pdf Writer)。今天晚上,我将尝试通过复制表格来分析问题
harrymc

我尝试了PrimoPDF和qvPDF(使用GhostScript)
endolith 2012年

请参阅我上面的内容。
harrymc

...我也将我的一页pdf文件上传到这里(等待时间为60秒)。
harrymc

0

另一种可能性是埃文斯

在Windows中,默认情况下似乎支持复制。

在Linux中,复制可以通过检查启用override_restrictions设置如果没有准备好,下面这些方向dconf-editor→交通/org/gnome/evince→交通override_restrictions)。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.