我有一些书页图像,希望使用OCR将其转换为文本


-1

您好,我有图像格式为tiff的书页,我想将这些页面中的文本提取到文本文件中,但是由于图像中的文本是草书,因此无法按需获取文本,因此请难将其转换为文本任何人都可以找到我的解决方案,让他们将其转换为文本。我已经在线尝试了许多解决方案,但是没有一个对我有用,因此请给我一些资源,可以为我提供帮助。


请告诉我们什么是“许多在线解决方案”。
slhck 2014年

Answers:



0

从逻辑上讲,使用已知字体执行OCR应该是一件容易的事。但是,我还没有听说过任何专门针对此特定问题的软件。大多数OCR程序都有通用算法来识别任何(或多种)字体。

不幸的是,识别质量与您为该软件支付的金额成比例。专有软件似乎产生了更好的结果。而且,免费软件,无论它有多少开发人员在吹牛,都经常失败并且质量低劣。

因此,如果您有兴趣获得良好的结果,那就准备为此付出好价钱。

顺便说一句,SO上的该线程涵盖了与您完全相同的问题。安德鲁·卡什(Andrew Cash)的回答那里列出了一些不错的程序。

我个人推荐ABBYY Lingvo,因为我自己用过,结果还可以。

祝好运

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.