如何从PDF中删除OCR?


14

我已经搜索Google一段时间了,但是找不到我的问题的答案。

我最近使用Adobe Acrobat扫描的文档中有不需要的OCR层。OCRed尚未正确运行,我想编辑一些信息,但是OCR正在删除需要的信息。我将文件转换为TIF,但是注意到(非常)重大的质量损失。我听说打印到另一个PDF会保留文本或降低图像质量。

感谢您为尽快解决此问题提供的帮助。

谢谢。

Answers:


6

在Acrobat Pro DC中,适当的命令是“删除隐藏的信息”,可通过“保护”和“编辑”工具使用。

在运行命令时,它只是搜索隐藏的信息,而不会更改文档。然后,您必须告诉Acrobat要删除哪些信息。在这种情况下,在“结果”窗格中选择“隐藏的文本”,然后单击“删除”按钮并保存更改的文档。


我使用了“删除隐藏的信息”,但是由于某些原因,我只删除了某些页面上的图像部分。但是,感谢您的答复。
Sanoo'4

这并非普遍如此。不知何故(可能是macOS PDFKit错误),我的ABBYY FineReader-OCRed文本已损坏,并在Redact→Remove Hidden下检查“ Hidden text”确实删除了文本,没有任何问题;然后,我能够成功地使用增强扫描→识别文本在Acrobat本身中执行OCR。
尼古拉斯·赖利

我的问题是,删除隐藏的文本后,我仍然无法使用“ ClearScan”(即“可编辑的文本和图像”)运行OCR。奇怪的是,文本层似乎消失了,但是运行OCR会产生错误“ Acrobat无法执行识别,因为:页面包含可渲染的文本。”
user1125483 '18

1

经过大量的实验,我发现从Adobe Acrobat打印到Adobe PDF可以在没有OCR且不损失质量的情况下打印文档(乍一看,分辨率不明显)。

但是,许多站点声称这不起作用。我也尝试了其他打印机,例如Foxit Reader和OneNote,但是质量降低了。JPEG也一样。

请记住,您的里程可能会有所不同。

注意:我将此线程标记为未回答,希望找到比我的更好的答案。


1

(一年前...)

如您所说,例如,如果文档被扫描并且没有从Word打印为PDF,则可以轻松地使用Adobe删除:

选择文档,检查文档,现在您可以删除隐藏的文本(OCR)。


感谢您的回复。我会尽快对其进行测试,并告知您。谢谢你的回答!
Sanoo '16

我以为我已经对此发表了评论,但是问题是我有Acrobat DC Pro,并且那些菜单已被删除。无论如何,谢谢您的回答。
萨努

1

在Acrobat Pro中:使用“删除隐藏的信息”(在“保护”下)。全选,执行,OCR不见了


1

在Acrobat X的“保护”下,有一个“清理文档”按钮,该按钮删除了所有但可见的内容(包括OCR的文本层),将文档转换为平坦的位图。


1

我先导出为JPEG,然后再导出为JPEG“ acrobat中的组合文件”来解决该问题。这来自最初是单词文档并已转换为PDF的文档。OCR不见了。


0

我构建了一个工具来执行此免费的PDF Redactor。如果您上载图片并单击编辑,它将使pdf变平并删除OCR。如果需要,还可以在文档上绘制标记。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.