我使用过SimpleOCR,它具有用于纠正错误的漂亮GUI。不幸的是,它会犯很多错误!(并遭受其他错误和限制)
另一方面,Tesseract更准确,但根本没有GUI。
我的问题是,是否有一个免费的Windows OCR程序,它具有不错的GUI 和较低的错误率?我希望它突出显示可疑单词(通过OCR不确定性,而不仅仅是拼写检查),并在编辑OCRed单词时显示原始(位图)单词,类似于SimpleOCR。
开源是最好的选择,其次是免费软件,然后是试用/演示/ crippleware,远远落后。
我使用过SimpleOCR,它具有用于纠正错误的漂亮GUI。不幸的是,它会犯很多错误!(并遭受其他错误和限制)
另一方面,Tesseract更准确,但根本没有GUI。
我的问题是,是否有一个免费的Windows OCR程序,它具有不错的GUI 和较低的错误率?我希望它突出显示可疑单词(通过OCR不确定性,而不仅仅是拼写检查),并在编辑OCRed单词时显示原始(位图)单词,类似于SimpleOCR。
开源是最好的选择,其次是免费软件,然后是试用/演示/ crippleware,远远落后。
Answers:
您是否尝试过Tesseract的gui前台gimagereader?
该软件部分基于Tesseract,它是目前可用的最佳开源OCR引擎。虽然该项目预计将于明年年底发布,并将用于Google的图书扫描项目,但该团队考虑了一些有趣的应用程序:
- Web服务界面
- PDF,相机和屏幕OCR
- 与桌面搜索工具集成:Beagle,Spotlight,Google桌面
OCRopus(tm)是最新的文档分析和OCR系统,具有可插拔布局分析,可插拔字符识别,统计自然语言建模和多语言功能。
OCRopus引擎基于两个研究项目:90年代中期开发并由美国人口普查局部署的高性能手写识别器,以及新颖的高性能布局分析方法。
OCRopus是Google赞助的开发项目,最初旨在进行高通量,大容量的文档转换工作。我们希望它对于许多其他应用也将是一个出色的OCR系统。 链接:
GOCR是根据GNU公共许可证开发的OCR(光学字符识别)程序。它将扫描的文本图像转换回文本文件。约尔格·舒伦堡(Joerg Schulenburg)启动了该计划,现在领导了一个开发团队。GOCR可以与不同的前端一起使用,这使得移植到不同的OS和体系结构非常容易。它可以打开许多不同的图像格式,并且其质量每天都在提高。
链接: