使用免费的开放源代码工具在OS X中的PDF上进行OCR
阅读这些博客文章后: Linux,OCR和PDF-已解决问题 使用开源工具ghostscript,horc2pdf和tesseract-ocr创建可搜索的PDF 将Tesseract OCR与PDF扫描结合使用 并要通过下面的代码段(从这个 GIST)的Linux,我想我找到OCR的方法多页PDF和得到的输出,可以在依赖OS X.大多数也工作在自制可用PDF (brew install tesseract和brew install imagemagick),但其中一个除外hocr2pdf。 我找不到OS X的端口。有没有可用的端口?如果不是,如何使用免费的开放源代码工具OCR编写多页PDF,并在OS X中以多页PDF重新获得结果? #!/bin/bash # This is a script to transform a PDF containing a scanned book into a searchable PDF. # Based on previous script and many good tips by Konrad Voelkel: # http://blog.konradvoelkel.de/2010/01/linux-ocr-and-pdf-problem-solved/ # http://blog.konradvoelkel.de/2013/03/scan-to-pdfa/ …