如何从PDF中删除OCR？

14

我已经搜索Google一段时间了，但是找不到我的问题的答案。

我最近使用Adobe Acrobat扫描的文档中有不需要的OCR层。OCRed尚未正确运行，我想编辑一些信息，但是OCR正在删除需要的信息。我将文件转换为TIF，但是注意到（非常）重大的质量损失。我听说打印到另一个PDF会保留文本或降低图像质量。

感谢您为尽快解决此问题提供的帮助。

谢谢。

— 佐野
source

6

在Acrobat Pro DC中，适当的命令是“删除隐藏的信息”，可通过“保护”和“编辑”工具使用。

在运行命令时，它只是搜索隐藏的信息，而不会更改文档。然后，您必须告诉Acrobat要删除哪些信息。在这种情况下，在“结果”窗格中选择“隐藏的文本”，然后单击“删除”按钮并保存更改的文档。

— 用户名
source

我使用了“删除隐藏的信息”，但是由于某些原因，我只删除了某些页面上的图像部分。但是，感谢您的答复。

— Sanoo'4

这并非普遍如此。不知何故（可能是macOS PDFKit错误），我的ABBYY FineReader-OCRed文本已损坏，并在Redact→Remove Hidden下检查“ Hidden text”确实删除了文本，没有任何问题；然后，我能够成功地使用增强扫描→识别文本在Acrobat本身中执行OCR。

— 尼古拉斯·赖利

我的问题是，删除隐藏的文本后，我仍然无法使用“ ClearScan”（即“可编辑的文本和图像”）运行OCR。奇怪的是，文本层似乎消失了，但是运行OCR会产生错误“ Acrobat无法执行识别，因为：页面包含可渲染的文本。”

— user1125483 '18

1

经过大量的实验，我发现从Adobe Acrobat打印到Adobe PDF可以在没有OCR且不损失质量的情况下打印文档（乍一看，分辨率不明显）。

但是，许多站点声称这不起作用。我也尝试了其他打印机，例如Foxit Reader和OneNote，但是质量降低了。JPEG也一样。

请记住，您的里程可能会有所不同。

注意：我将此线程标记为未回答，希望找到比我的更好的答案。

— 佐野
source

1

（一年前...）

如您所说，例如，如果文档被扫描并且没有从Word打印为PDF，则可以轻松地使用Adobe删除：

选择文档，检查文档，现在您可以删除隐藏的文本（OCR）。

— 弗兰
source

感谢您的回复。我会尽快对其进行测试，并告知您。谢谢你的回答！

— Sanoo '16

我以为我已经对此发表了评论，但是问题是我有Acrobat DC Pro，并且那些菜单已被删除。无论如何，谢谢您的回答。

— 萨努

1

在Acrobat Pro中：使用“删除隐藏的信息”（在“保护”下）。全选，执行，OCR不见了

— 爵士乐
source

1

在Acrobat X的“保护”下，有一个“清理文档”按钮，该按钮删除了所有但可见的内容（包括OCR的文本层），将文档转换为平坦的位图。

— 戴夫
source

1

我先导出为JPEG，然后再导出为JPEG“ acrobat中的组合文件”来解决该问题。这来自最初是单词文档并已转换为PDF的文档。OCR不见了。

— 兰多·卡尔
source

0

我构建了一个工具来执行此免费的PDF Redactor。如果您上载图片并单击编辑，它将使pdf变平并删除OCR。如果需要，还可以在文档上绘制标记。

— 生物学
source