电脑用户 tesseract-ocr

3

我使用的源代码对其进行了编译leptonica。这是具有透明背景的png图像，我对其进行了编辑，添加了蓝色，但仍然出现此错误： Tesseract Open Source OCR Engine v3.02.02 with Leptonica Empty page!! Empty page!! 这是图像输入：

5 ocr tesseract-ocr

1

培训Tesseract-OCR用于英语字体

我有大约3000个单个单词的小图像，我试图转换为文本。我已经使用安装程序在我的Windows 7机器上安装了tesseract，并通过cmd和powershell成功管理到OCR映像。 tesseract.exe imagename.png imagename 生成带有转换文本的文本文件。我得到的结果非常糟糕，只有大约40％的角色被成功转换。我想改进结果。有谁知道在这个命令中可以给出的可选配置是什么？必需的参数是： tesseract imagename outputbase [- lang] [configfile [+|-]varfile]...] 也有人可以描述训练程序，我发现很难理解文档。我知道我的文字有时是新的罗马文字。我是否需要为TNR训练它，或者是否已经内置和/或是否可以下载允许tesseract识别它的文件？

3 ocr tesseract-ocr

2

Linux上的Tesseract

收到警告时如何解决问题而不必安装tesseract 3.03：警告：您正在运行不受支持的Tesseract版本。预期版本为3.03，您的版本为：3.02.02打开数据文件/usr/local/share/tessdata/lus.traineddata时出错，请确保将TESSDATA_PREFIX环境变量设置为“ tessdata”目录的父目录。加载语言'lus'失败Tesseract无法加载任何语言！分段故障（核心已转储）

1 linux tesseract-ocr

1

如何使OCR识别此图像

原始图像我认为识别这张图片中的数字确实很容易，但是tesseract和许多在线OCR都无法识别它。然后我像这样处理它。过程映像不幸的是，tesseract仍然无法识别它。我的tesseract参数： tesseract input output digits -psm 7 那只会返回一个点 .

1 ocr tesseract-ocr

Questions tagged «tesseract-ocr»