Questions tagged «ocr»


7
将OCR信息添加到PDF
我的文件扫描质量很好;此类扫描为pdf格式。 如何将ocr信息添加到pdf中,以便可以搜索?可搜索的意思是目标是当您查看pdf时,CTRL-F实际上允许我搜索pdf内容。
28 pdf  scanning  ocr 


2
如何从图像中提取文本?
如何从图像中提取文本? 我说的不是扫描文件,而是花园里的各种图像,例如当您在课堂上拍摄黑板的高清照片时,它的手写效果很好。或者当您从食谱书中拍摄一页并希望以文本格式获取食谱时。 有免费的开放软件吗? 我尝试了tesseract,结果很糟糕。

6
如何将pdf转换为可文本搜索的pdf?
我有许多pdf扫描的文档,我希望能够搜索它们。我怎样才能做到这一点? 本质上,我必须对PDF进行OCR,然后将提取的文本混合回新的pdf中。我尝试了许多不同的解决方案(包括将OCR信息添加到PDF中找到的解决方案)未成功。 pdfocr(给我这个问题:https : //github.com/gkovacs/pdfocr/issues/7) pdfsandwich(软件中心表示它是一个较差的软件包,我不应该安装它) OCRfeeder(在软件中心)可以很好地导出到odt,但是在导出为pdf时不起作用。 Gscan2pdf导出本讨论中报告的全黑(但可搜索)图像。 我认为Pdfxchange查看器无法处理超过500页的文件的ocr。 是否有我不知道的软件包?或执行此操作的脚本?

1
如何在16.04上为Tesseract安装新的语言包
刚刚安装了gscan2pdf v1.3.9以及Tesseract。至于后者,它首先出现在我的“已安装软件”列表的底部,但现在似乎消失了,尽管仍然可以使用(我认为)。 无论如何,我正在尝试将扫描文档的pdf转换为可编辑的文本,但是该文档不是英文的,因此gscan使它变得一团糟。 唯一的选择,我是说我去Tools > OCR > Language to recognize的English,equ和osd。关于如何安装特定语言包的任何想法? 我不是经验丰富的Linux用户,所以分步说明将不胜感激。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.