程序设计 ocr

3

我正在尝试在OpenCV-Python（cv2）中实现“数字识别OCR”。它仅用于学习目的。我想学习OpenCV中的KNearest和SVM功能。我每个数字有100个样本（即图像）。我想和他们一起训练。 letter_recog.pyOpenCV示例附带一个示例。但是我仍然不知道如何使用它。我不了解样本，响应等内容。此外，它首先会加载txt文件，而我首先并不了解。稍后进行搜索时，我可以在cpp样本中找到letter_recognitiontion.data。我用它并在letter_recog.py模型中为cv2.KNearest编写了一个代码（仅用于测试）： import numpy as np import cv2 fn = 'letter-recognition.data' a = np.loadtxt(fn, np.float32, delimiter=',', converters={ 0 : lambda ch : ord(ch)-ord('A') }) samples, responses = a[:,1:], a[:,0] model = cv2.KNearest() retval = model.train(samples,responses) retval, results, neigh_resp, dists = model.find_nearest(samples, k = 10) print results.ravel() 它给了我一个大小为20000的数组，我不知道它是什么。问题： …

380 python opencv numpy computer-vision ocr

14

reCaptcha是否已被破解/被黑客入侵/ OCR被打败/被破坏？[关闭]

这个问题不太可能对将来的访客有所帮助；它仅与较小的地理区域，特定的时间段或极为狭窄的情况（通常不适用于Internet的全球受众）有关。要获得使该问题更广泛适用的帮助，请访问帮助中心。 7年前关闭。是否使用任何编程方法来击败reCAPTCHA？我有兴趣看到证据，并可能证明完全自动化，无人值守的方法已使reCAPTCHA过时。需要澄清的是，无论团队是否负责填写CAPCHA，色情搜索者或机械特克，都不要寻找任何涉及人类的reCAPTCHA作弊解决方案。我也没有在寻找reCAPTCHA的替代方法，例如选择动物的类型，背景字段或JavaScript技巧。

172 security captcha ocr recaptcha

5

Java OCR实现[关闭]

关闭。此问题不符合堆栈溢出准则。它当前不接受答案。想改善这个问题吗？更新问题，使其成为Stack Overflow 的主题。 4年前关闭。改善这个问题这主要只是出于好奇，但是在纯Java中是否有任何OCR实现？我很好奇这将如何在Java中完全实现，而OCR通常令我感兴趣，所以我很想看看它是如何以我完全理解的语言实现的。自然，这将要求实现是开源的，但是我仍然对专有解决方案感兴趣，因为我至少可以检查这种情况下的性能。我已经看到了可以在Java中使用的一对夫妇（例如Asprise），但似乎这些不是纯Java实现...有没有？

160 java ocr

6

是否有适用于Android的免费OCR库？[关闭]

按照目前的情况，这个问题不适合我们的问答形式。我们希望答案会得到事实，参考或专业知识的支持，但是这个问题可能会引起辩论，争论，民意测验或进一步的讨论。如果您认为此问题可以解决并且可以重新提出，请访问帮助中心以获取指导。 8年前关闭。我正在寻找可以在Android上运行的Java OCR，但是Asprise似乎并不是独立于平台的OCR。我可以使用任何开源/免费的Java OCR进行android应用程序开发吗？

148 android ocr

13

图像处理以提高tesseract OCR精度

我一直在使用tesseract将文档转换为文本。文档的质量千差万别，我正在寻找有关哪种图像处理可以改善结果的提示。我注意到，像素化程度很高的文本（例如，由传真机生成的文本）对于tesseract来说尤其难以处理-大概字符的所有那些锯齿状边缘都会混淆形状识别算法。哪种图像处理技术可以提高准确性？我一直在使用高斯模糊对像素化的图像进行平滑处理，并且看到了一些小的改进，但是我希望有一种更具体的技术可以产生更好的结果。说一个调整为黑白图像的滤镜，它将平滑不规则的边缘，然后说一个滤镜，它将增加对比度以使字符更加清晰。对图像处理新手有何一般提示？

145 image-processing ocr tesseract

4

我如何在Tesseract和OpenCV之间进行选择？[关闭]

已关闭。这个问题是基于观点的。它当前不接受答案。想改善这个问题吗？更新问题，以便通过编辑此帖子以事实和引用的形式回答。去年关闭。改善这个问题我最近遇到过Tesseract和OpenCV。看起来Tesseract是成熟的OCR引擎，而OpenCV可以用作创建OCR应用程序/服务的框架。我尝试在某些图像上使用Tesseract，其准确性似乎不错。后来，我遇到了一个有关使用OpenCV使用Python执行OCR 的非常简单的教程，这给我留下了深刻的印象。几分钟后，我完成了对该系统的培训，其准确性非常好。但是，当然，采用这种方法意味着我需要使用大型训练集来广泛地训练系统。我的具体问题如下：如何在Tesseract和使用OpenCV构建自定义OCR应用之间进行选择？对于Tesseract，有针对不同语言的培训数据集。OpenCV是否具有类似的功能，所以我不必重新开始就可以实现OCR？对于想成为商业应用程序的哪个更好？有什么建议？

93 python opencv computer-vision ocr tesseract

11

Tesseract运行错误

我在Linux上运行tesseract-ocr引擎时遇到问题。我已经下载了RUS语言数据并将其放入tessdata目录（/ usr / local / share / tessdata）。当我尝试使用command运行tesseract时tesseract blob.jpg out -l rus，它显示错误： Error opening data file /usr/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language eng Tesseract couldn't load any languages! Could not initialize tesseract. 根据编译指南，我曾经export TESSDATA_PREFIX='/usr/local/share/' 指向tessdata目录。也许我应该编辑任何配置文件？Tesseract尝试加载“ …

80 ocr tesseract

1

如何获得索引服务和MODI以通过OCR产生全文？

我已经配置了索引服务来索引我的文件，其中还包括另存为高分辨率TIFF文件的扫描图像。我还安装了MS Office 2003+，并正确配置了MS Office文档映像（MODI），因此我可以对图像执行OCR，甚至可以将OCR文本嵌入TIFF。索引服务能够索引和查找那些TIFF通过手动OCR'd并重新保存文本数据（使用MS文档成像工具）-S。事实证明，与Windows XP SP2一起部署的数据执行保护（DEP）认为MODI是恶意的，并且拒绝让它发挥作用。我已经能够通过完全关闭DEP使其工作，但是我发现这种解决方案不太理想。是否有更好的解决方案可以在不禁用DEP的情况下完成此工作？

75 ocr modi indexing-service

7

限制字符tesseract寻找

是否可以限制tesseract寻找的字符集（例如，仅搜索字母az）？那将大大改善我的结果。

73 ocr tesseract

12

如何从图像中识别车辆牌照/车牌（ANPR）？[关闭]

已关闭。这个问题需要更加集中。它当前不接受答案。想改善这个问题吗？更新问题，使其仅通过编辑此帖子来关注一个问题。 2年前关闭。改善这个问题我有一个允许用户上传汽车图像的网站，我想放置一个隐私过滤器以检测车辆上的车牌并使它们模糊。模糊不是问题，但是是否有一个库或组件（首选开放源代码）可以帮助在照片中查找许可证？注意事项；我知道没有什么是完美的，这种类型的图像识别会带来假阳性和阴性。我很高兴我们可以要求用户选择要模糊的区域，我们也将这样做，但是问题特别是关于以编程方式查找该数据；因此，诸如“请人检查每张图片”之类的答案无济于事。这种软件方法在英国称为“自动车牌识别”，但我看不到它的任何实现为库。尽管.Net是首选，但任何语言都很棒。

70 image ocr computer-vision anpr

1

android中最好的OCR（光学字符识别）示例

关闭。此问题不符合堆栈溢出准则。它当前不接受答案。想改善这个问题吗？更新问题，使其成为Stack Overflow的主题。 7年前关闭。改善这个问题我想要一个在Android中运行OCR的示例，我进行了一些研究并找到了一个在android中实现OCR的示例。 https://github.com/rmtheis/tess-two，其中有三个项目文件... 两眼特斯二 TESTS二次测试我已经通过导入三个项目文件执行了“ tess-two-test”项目，但是“ tess-two-test”不包含任何活动，因此不会运行。有人可以建议我做一个更好的例子吗？

70 android ocr tesseract

1

OCR的清洁图像

我一直在尝试清除OCR的图像：（线条）我需要删除这些行以有时对图像进行进一步处理，并且我已经很接近了，但是在很多情况下，阈值从文本中去除了太多： copy = img.copy() blur = cv2.GaussianBlur(copy, (9,9), 0) thresh = cv2.adaptiveThreshold(blur,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV,11,30) kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9,9)) dilate = cv2.dilate(thresh, kernel, iterations=2) cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cnts = cnts[0] if len(cnts) == 2 else cnts[1] for c in cnts: area = cv2.contourArea(c) if area > 300: x,y,w,h = …

9 python opencv image-processing ocr image-segmentation

Questions tagged «ocr»