程序设计 tesseract

13

我一直在使用tesseract将文档转换为文本。文档的质量千差万别，我正在寻找有关哪种图像处理可以改善结果的提示。我注意到，像素化程度很高的文本（例如，由传真机生成的文本）对于tesseract来说尤其难以处理-大概字符的所有那些锯齿状边缘都会混淆形状识别算法。哪种图像处理技术可以提高准确性？我一直在使用高斯模糊对像素化的图像进行平滑处理，并且看到了一些小的改进，但是我希望有一种更具体的技术可以产生更好的结果。说一个调整为黑白图像的滤镜，它将平滑不规则的边缘，然后说一个滤镜，它将增加对比度以使字符更加清晰。对图像处理新手有何一般提示？

145 image-processing ocr tesseract

4

我如何在Tesseract和OpenCV之间进行选择？[关闭]

已关闭。这个问题是基于观点的。它当前不接受答案。想改善这个问题吗？更新问题，以便通过编辑此帖子以事实和引用的形式回答。去年关闭。改善这个问题我最近遇到过Tesseract和OpenCV。看起来Tesseract是成熟的OCR引擎，而OpenCV可以用作创建OCR应用程序/服务的框架。我尝试在某些图像上使用Tesseract，其准确性似乎不错。后来，我遇到了一个有关使用OpenCV使用Python执行OCR 的非常简单的教程，这给我留下了深刻的印象。几分钟后，我完成了对该系统的培训，其准确性非常好。但是，当然，采用这种方法意味着我需要使用大型训练集来广泛地训练系统。我的具体问题如下：如何在Tesseract和使用OpenCV构建自定义OCR应用之间进行选择？对于Tesseract，有针对不同语言的培训数据集。OpenCV是否具有类似的功能，所以我不必重新开始就可以实现OCR？对于想成为商业应用程序的哪个更好？有什么建议？

93 python opencv computer-vision ocr tesseract

11

Tesseract运行错误

我在Linux上运行tesseract-ocr引擎时遇到问题。我已经下载了RUS语言数据并将其放入tessdata目录（/ usr / local / share / tessdata）。当我尝试使用command运行tesseract时tesseract blob.jpg out -l rus，它显示错误： Error opening data file /usr/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language eng Tesseract couldn't load any languages! Could not initialize tesseract. 根据编译指南，我曾经export TESSDATA_PREFIX='/usr/local/share/' 指向tessdata目录。也许我应该编辑任何配置文件？Tesseract尝试加载“ …

80 ocr tesseract

7

限制字符tesseract寻找

是否可以限制tesseract寻找的字符集（例如，仅搜索字母az）？那将大大改善我的结果。

73 ocr tesseract

20

Pytesseract：“ TesseractNotFound错误：tesseract未安装或不在您的路径中”，如何解决此问题？

我正在尝试在python中运行基本且非常简单的代码。 from PIL import Image import pytesseract im = Image.open("sample1.jpg") text = pytesseract.image_to_string(im, lang = 'eng') print(text) 看起来就是这样，我实际上已经通过安装程序为Windows安装了tesseract。我是Python的新手，不确定如何继续？这里的任何指导将非常有帮助。我尝试重新启动Spyder应用程序，但无济于事。

73 python tesseract

1

android中最好的OCR（光学字符识别）示例

关闭。此问题不符合堆栈溢出准则。它当前不接受答案。想改善这个问题吗？更新问题，使其成为Stack Overflow的主题。 7年前关闭。改善这个问题我想要一个在Android中运行OCR的示例，我进行了一些研究并找到了一个在android中实现OCR的示例。 https://github.com/rmtheis/tess-two，其中有三个项目文件... 两眼特斯二 TESTS二次测试我已经通过导入三个项目文件执行了“ tess-two-test”项目，但是“ tess-two-test”不包含任何活动，因此不会运行。有人可以建议我做一个更好的例子吗？

70 android ocr tesseract

Questions tagged «tesseract»