Questions tagged «tesseract-ocr»

3
OCR Tesseract,空白页错误?
我使用的源代码对其进行了编译leptonica。这是具有透明背景的png图像,我对其进行了编辑,添加了蓝色,但仍然出现此错误: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Empty page!! Empty page!! 这是图像输入:

1
培训Tesseract-OCR用于英语字体
我有大约3000个单个单词的小图像,我试图转换为文本。我已经使用安装程序在我的Windows 7机器上安装了tesseract,并通过cmd和powershell成功管理到OCR映像。 tesseract.exe imagename.png imagename 生成带有转换文本的文本文件。 我得到的结果非常糟糕,只有大约40%的角色被成功转换。我想改进结果。 有谁知道在这个命令中可以给出的可选配置是什么?必需的参数是: tesseract imagename outputbase [- lang] [configfile [+|-]varfile]...] 也有人可以描述训练程序,我发现很难理解文档。我知道我的文字有时是新的罗马文字。我是否需要为TNR训练它,或者是否已经内置和/或是否可以下载允许tesseract识别它的文件?

2
Linux上的Tesseract
收到警告时如何解决问题而不必安装tesseract 3.03: 警告:您正在运行不受支持的Tesseract版本。预期版本为3.03,您的版本为:3.02.02打开数据文件/usr/local/share/tessdata/lus.traineddata时出错,请确保将TESSDATA_PREFIX环境变量设置为“ tessdata”目录的父目录。加载语言'lus'失败Tesseract无法加载任何语言!分段故障(核心已转储)

1
如何使OCR识别此图像
原始图像 我认为识别这张图片中的数字确实很容易,但是tesseract和许多在线OCR都无法识别它。然后我像这样处理它。 过程映像 不幸的是,tesseract仍然无法识别它。 我的tesseract参数: tesseract input output digits -psm 7 那只会返回一个点 .
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.