Questions tagged «ocr»

光学字符识别(OCR)是将文本图像转换为可由文字处理器等处理的文本的过程。

1
在阿拉伯语文本上使用OCR
朋友要求我将阿拉伯语文本.pdf转换为Word。谷歌文档似乎不是一个选项,但新的OCR看起来很有希望,因为阿拉伯语在“识别语言”下拉列表中有特色。我无法让它超越“错误!无法识别文本”。即使只有几个样本页面(111KB)。 我非常感谢有关我在该网站上做错了什么的建议(甚至是如何访问那里的任何帮助!)或者指向使用阿拉伯文本的其他(免费!)选项(最好不需要注册和或大量下载)。有人愿意帮忙吗? 请注意,.pdf没有文本图层。
3 ocr 

1
培训Tesseract-OCR用于英语字体
我有大约3000个单个单词的小图像,我试图转换为文本。我已经使用安装程序在我的Windows 7机器上安装了tesseract,并通过cmd和powershell成功管理到OCR映像。 tesseract.exe imagename.png imagename 生成带有转换文本的文本文件。 我得到的结果非常糟糕,只有大约40%的角色被成功转换。我想改进结果。 有谁知道在这个命令中可以给出的可选配置是什么?必需的参数是: tesseract imagename outputbase [- lang] [configfile [+|-]varfile]...] 也有人可以描述训练程序,我发现很难理解文档。我知道我的文字有时是新的罗马文字。我是否需要为TNR训练它,或者是否已经内置和/或是否可以下载允许tesseract识别它的文件?

5
Babylon无法识别Firefox和IE 9上的文本
在我升级到Firefox 4和IE 9之前,Babylon成功地识别了这些浏览器上的文本。升级后,它无法识别文本。我在高级设置中使用了OCR优化,但它没有帮助。但是,Babylon在这些浏览器中运行良好。 是否有针对此问题的解决方法或解决方案? 注意:我使用的是Firefox 44,问题仍然存在。

1
什么是JPEG文本操作的最佳方法?
我有一个相对简单的图形; 一个包含各种文本的技术图表。 该文本使用其他语言(捷克语/斯洛伐克语)。它打印得足够清晰,可以通过(Android)Google Translate的OCR进行准确区分和解释。无论如何,我想用英文翻译替换文本。 在这种情况下,只是剪切/隐藏当前文本,然后使用基本编辑工具添加所有新文本框并不困难。但如果我只是简单地选择和编辑文本就可以了,就像某些PDF编辑器能够做到的那样。 我尝试将JPEG / PNG导出为PDF,然后使用Libre Office进行编辑。但是创建空白文档并插入图像也没有什么不同; 这只是一个单一的对象。 我理解为什么,我不指望魔法。但有没有人有这方面的技术?


1
OCR PDF解析选定区域
我有很多帐户余额文档,我需要从这些文档中的表创建一个Excel文件。 我可以进行正常的OCR识别,但主要的问题是这些PDF有页眉,页脚页表头等等,我想只为每个页面解析页面的选定区域(带x,y坐标) 。 是否有可能做到这一点?
1 pdf  ocr 


1
如何使OCR识别此图像
原始图像 我认为识别这张图片中的数字确实很容易,但是tesseract和许多在线OCR都无法识别它。然后我像这样处理它。 过程映像 不幸的是,tesseract仍然无法识别它。 我的tesseract参数: tesseract input output digits -psm 7 那只会返回一个点 .



2
我有一些书页图像,希望使用OCR将其转换为文本
您好,我有图像格式为tiff的书页,我想将这些页面中的文本提取到文本文件中,但是由于图像中的文本是草书,因此无法按需获取文本,因此请难将其转换为文本任何人都可以找到我的解决方案,让他们将其转换为文本。我已经在线尝试了许多解决方案,但是没有一个对我有用,因此请给我一些资源,可以为我提供帮助。
-1 ocr 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.