我最近遇到过Tesseract和OpenCV。看起来Tesseract是成熟的OCR引擎,而OpenCV可以用作创建OCR应用程序/服务的框架。
我尝试在某些图像上使用Tesseract,其准确性似乎不错。后来,我遇到了一个有关使用OpenCV使用Python执行OCR 的非常简单的教程,这给我留下了深刻的印象。几分钟后,我完成了对该系统的培训,其准确性非常好。但是,当然,采用这种方法意味着我需要使用大型训练集来广泛地训练系统。
我的具体问题如下:
- 如何在Tesseract和使用OpenCV构建自定义OCR应用之间进行选择?
- 对于Tesseract,有针对不同语言的培训数据集。OpenCV是否具有类似的功能,所以我不必重新开始就可以实现OCR?
- 对于想成为商业应用程序的哪个更好?
有什么建议?
OCR accuracy tests
,您会发现一些图表。在谈论移动应用程序时,大多数都使用tesseract。但是,如果您不愿意下载其中的一些内容,则会发现结果与承诺的内容有所不同。他们通常会在精心控制的环境中制作视频演示,然后将其发布到youtube上,但在野外,如果您扫描页面/食谱/卡片/任何内容,都会得到一些有趣的结果。