Questions tagged «ocr»

光学字符识别通常缩写为OCR,是将手写,打字或印刷文本的扫描图像机械或电子翻译为机器编码的文本。以下主题(尽管有些是不同的应用领域)通常也称为OCR:手写文本识别(HTR),光学文字识别(OWR),智能字符识别(ICR),智能文字识别(IWR)。

3
OpenCV-Python中的简单数字识别OCR
我正在尝试在OpenCV-Python(cv2)中实现“数字识别OCR”。它仅用于学习目的。我想学习OpenCV中的KNearest和SVM功能。 我每个数字有100个样本(即图像)。我想和他们一起训练。 letter_recog.pyOpenCV示例附带一个示例。但是我仍然不知道如何使用它。我不了解样本,响应等内容。此外,它首先会加载txt文件,而我首先并不了解。 稍后进行搜索时,我可以在cpp样本中找到letter_recognitiontion.data。我用它并在letter_recog.py模型中为cv2.KNearest编写了一个代码(仅用于测试): import numpy as np import cv2 fn = 'letter-recognition.data' a = np.loadtxt(fn, np.float32, delimiter=',', converters={ 0 : lambda ch : ord(ch)-ord('A') }) samples, responses = a[:,1:], a[:,0] model = cv2.KNearest() retval = model.train(samples,responses) retval, results, neigh_resp, dists = model.find_nearest(samples, k = 10) print results.ravel() 它给了我一个大小为20000的数组,我不知道它是什么。 问题: …

14
reCaptcha是否已被破解/被黑客入侵/ OCR被打败/被破坏?[关闭]
这个问题不太可能对将来的访客有所帮助;它仅与较小的地理区域,特定的时间段或极为狭窄的情况(通常不适用于Internet的全球受众)有关。要获得使该问题更广泛适用的帮助,请访问帮助中心。 7年前关闭。 是否使用任何编程方法来击败reCAPTCHA? 我有兴趣看到证据,并可能证明完全自动化,无人值守的方法已使reCAPTCHA过时。 需要澄清的是,无论团队是否负责填写CAPCHA,色情搜索者或机械特克,都不要寻找任何涉及人类的reCAPTCHA作弊解决方案。 我也没有在寻找reCAPTCHA的替代方法,例如选择动物的类型,背景字段或JavaScript技巧。

5
Java OCR实现[关闭]
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow 的主题。 4年前关闭。 改善这个问题 这主要只是出于好奇,但是在纯Java中是否有任何OCR实现?我很好奇这将如何在Java中完全实现,而OCR通常令我感兴趣,所以我很想看看它是如何以我完全理解的语言实现的。自然,这将要求实现是开源的,但是我仍然对专有解决方案感兴趣,因为我至少可以检查这种情况下的性能。 我已经看到了可以在Java中使用的一对夫妇(例如Asprise),但似乎这些不是纯Java实现...有没有?
160 java  ocr 

6
是否有适用于Android的免费OCR库?[关闭]
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案会得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意测验或进一步的讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心以获取指导。 8年前关闭。 我正在寻找可以在Android上运行的Java OCR,但是Asprise似乎并不是独立于平台的OCR。我可以使用任何开源/免费的Java OCR进行android应用程序开发吗?
148 android  ocr 

13
图像处理以提高tesseract OCR精度
我一直在使用tesseract将文档转换为文本。文档的质量千差万别,我正在寻找有关哪种图像处理可以改善结果的提示。我注意到,像素化程度很高的文本(例如,由传真机生成的文本)对于tesseract来说尤其难以处理-大概字符的所有那些锯齿状边缘都会混淆形状识别算法。 哪种图像处理技术可以提高准确性?我一直在使用高斯模糊对像素化的图像进行平滑处理,并且看到了一些小的改进,但是我希望有一种更具体的技术可以产生更好的结果。说一个调整为黑白图像的滤镜,它将平滑不规则的边缘,然后说一个滤镜,它将增加对比度以使字符更加清晰。 对图像处理新手有何一般提示?

4
我如何在Tesseract和OpenCV之间进行选择?[关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引用的形式回答。 去年关闭。 改善这个问题 我最近遇到过Tesseract和OpenCV。看起来Tesseract是成熟的OCR引擎,而OpenCV可以用作创建OCR应用程序/服务的框架。 我尝试在某些图像上使用Tesseract,其准确性似乎不错。后来,我遇到了一个有关使用OpenCV使用Python执行OCR 的非常简单的教程,这给我留下了深刻的印象。几分钟后,我完成了对该系统的培训,其准确性非常好。但是,当然,采用这种方法意味着我需要使用大型训练集来广泛地训练系统。 我的具体问题如下: 如何在Tesseract和使用OpenCV构建自定义OCR应用之间进行选择? 对于Tesseract,有针对不同语言的培训数据集。OpenCV是否具有类似的功能,所以我不必重新开始就可以实现OCR? 对于想成为商业应用程序的哪个更好? 有什么建议?

11
Tesseract运行错误
我在Linux上运行tesseract-ocr引擎时遇到问题。我已经下载了RUS语言数据并将其放入tessdata目录(/ usr / local / share / tessdata)。当我尝试使用command运行tesseract时tesseract blob.jpg out -l rus,它显示错误: Error opening data file /usr/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language eng Tesseract couldn't load any languages! Could not initialize tesseract. 根据编译指南,我曾经export TESSDATA_PREFIX='/usr/local/share/' 指向tessdata目录。也许我应该编辑任何配置文件?Tesseract尝试加载“ …
80 ocr  tesseract 

1
如何获得索引服务和MODI以通过OCR产生全文?
我已经配置了索引服务来索引我的文件,其中还包括另存为高分辨率TIFF文件的扫描图像。我还安装了MS Office 2003+,并正确配置了MS Office文档映像(MODI),因此我可以对图像执行OCR,甚至可以将OCR文本嵌入TIFF。 索引服务能够索引和查找那些TIFF通过手动OCR'd并重新保存文本数据(使用MS文档成像工具)-S。 事实证明,与Windows XP SP2一起部署的数据执行保护(DEP)认为MODI是恶意的,并且拒绝让它发挥作用。我已经能够通过完全关闭DEP使其工作,但是我发现这种解决方案不太理想。 是否有更好的解决方案可以在不禁用DEP的情况下完成此工作?


12
如何从图像中识别车辆牌照/车牌(ANPR)?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 2年前关闭。 改善这个问题 我有一个允许用户上传汽车图像的网站,我想放置一个隐私过滤器以检测车辆上的车牌并使它们模糊。 模糊不是问题,但是是否有一个库或组件(首选开放源代码)可以帮助在照片中查找许可证? 注意事项; 我知道没有什么是完美的,这种类型的图像识别会带来假阳性和阴性。 我很高兴我们可以要求用户选择要模糊的区域,我们也将这样做,但是问题特别是关于以编程方式查找该数据;因此,诸如“请人检查每张图片”之类的答案无济于事。 这种软件方法在英国称为“自动车牌识别”,但我看不到它的任何实现为库。 尽管.Net是首选,但任何语言都很棒。

1
android中最好的OCR(光学字符识别)示例
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow的主题。 7年前关闭。 改善这个问题 我想要一个在Android中运行OCR的示例,我进行了一些研究并找到了一个在android中实现OCR的示例。 https://github.com/rmtheis/tess-two,其中有三个项目文件... 两眼 特斯二 TESTS二次测试 我已经通过导入三个项目文件执行了“ tess-two-test”项目,但是“ tess-two-test”不包含任何活动,因此不会运行。 有人可以建议我做一个更好的例子吗?
70 android  ocr  tesseract 

1
OCR的清洁图像
我一直在尝试清除OCR的图像:(线条) 我需要删除这些行以有时对图像进行进一步处理,并且我已经很接近了,但是在很多情况下,阈值从文本中去除了太多: copy = img.copy() blur = cv2.GaussianBlur(copy, (9,9), 0) thresh = cv2.adaptiveThreshold(blur,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV,11,30) kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9,9)) dilate = cv2.dilate(thresh, kernel, iterations=2) cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cnts = cnts[0] if len(cnts) == 2 else cnts[1] for c in cnts: area = cv2.contourArea(c) if area > 300: x,y,w,h = …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.