如何将pdf转换为可文本搜索的pdf?
我有许多pdf扫描的文档,我希望能够搜索它们。我怎样才能做到这一点? 本质上,我必须对PDF进行OCR,然后将提取的文本混合回新的pdf中。我尝试了许多不同的解决方案(包括将OCR信息添加到PDF中找到的解决方案)未成功。 pdfocr(给我这个问题:https : //github.com/gkovacs/pdfocr/issues/7) pdfsandwich(软件中心表示它是一个较差的软件包,我不应该安装它) OCRfeeder(在软件中心)可以很好地导出到odt,但是在导出为pdf时不起作用。 Gscan2pdf导出本讨论中报告的全黑(但可搜索)图像。 我认为Pdfxchange查看器无法处理超过500页的文件的ocr。 是否有我不知道的软件包?或执行此操作的脚本?