电脑用户 ocr

1

朋友要求我将阿拉伯语文本.pdf转换为Word。谷歌文档似乎不是一个选项，但新的OCR看起来很有希望，因为阿拉伯语在“识别语言”下拉列表中有特色。我无法让它超越“错误！无法识别文本”。即使只有几个样本页面（111KB）。我非常感谢有关我在该网站上做错了什么的建议（甚至是如何访问那里的任何帮助！）或者指向使用阿拉伯文本的其他（免费！）选项（最好不需要注册和或大量下载）。有人愿意帮忙吗？请注意，.pdf没有文本图层。

3 ocr

1

培训Tesseract-OCR用于英语字体

我有大约3000个单个单词的小图像，我试图转换为文本。我已经使用安装程序在我的Windows 7机器上安装了tesseract，并通过cmd和powershell成功管理到OCR映像。 tesseract.exe imagename.png imagename 生成带有转换文本的文本文件。我得到的结果非常糟糕，只有大约40％的角色被成功转换。我想改进结果。有谁知道在这个命令中可以给出的可选配置是什么？必需的参数是： tesseract imagename outputbase [- lang] [configfile [+|-]varfile]...] 也有人可以描述训练程序，我发现很难理解文档。我知道我的文字有时是新的罗马文字。我是否需要为TNR训练它，或者是否已经内置和/或是否可以下载允许tesseract识别它的文件？

3 ocr tesseract-ocr

5

Babylon无法识别Firefox和IE 9上的文本

在我升级到Firefox 4和IE 9之前，Babylon成功地识别了这些浏览器上的文本。升级后，它无法识别文本。我在高级设置中使用了OCR优化，但它没有帮助。但是，Babylon在这些浏览器中运行良好。是否有针对此问题的解决方法或解决方案？注意：我使用的是Firefox 44，问题仍然存在。

3 firefox internet-explorer-9 ocr babylon

1

什么是JPEG文本操作的最佳方法？

我有一个相对简单的图形; 一个包含各种文本的技术图表。该文本使用其他语言（捷克语/斯洛伐克语）。它打印得足够清晰，可以通过（Android）Google Translate的OCR进行准确区分和解释。无论如何，我想用英文翻译替换文本。在这种情况下，只是剪切/隐藏当前文本，然后使用基本编辑工具添加所有新文本框并不困难。但如果我只是简单地选择和编辑文本就可以了，就像某些PDF编辑器能够做到的那样。我尝试将JPEG / PNG导出为PDF，然后使用Libre Office进行编辑。但是创建空白文档并插入图像也没有什么不同; 这只是一个单一的对象。我理解为什么，我不指望魔法。但有没有人有这方面的技术？

2 pdf jpeg image-editing ocr text-manipulation

0

在OCR准备中，哪种格式最适合屏幕捕获？ [关闭]

为了获得最佳OCR，应该采用什么格式（png，tiff，pdf）？在将图像转换为pdf之前，是否有一些OCR包在png或tiff上执行OCR以提取文本以利用前者的更高分辨率？

1 pdf screen-capture ocr

1

OCR PDF解析选定区域

我有很多帐户余额文档，我需要从这些文档中的表创建一个Excel文件。我可以进行正常的OCR识别，但主要的问题是这些PDF有页眉，页脚页表头等等，我想只为每个页面解析页面的选定区域（带x，y坐标）。是否有可能做到这一点？

1 pdf ocr

3

将图表从图像导入电子表格

如何将扫描图像（jpg / pdf）文件中的表格导入电子表格？示例扫描在这里