Answers:
Evernote API具有获取文本和矩形的功能,这些文本位于图像中。请参阅http://evernote.com/about/developer/api/evernote-api.htm,查看“ Evernote识别索引XML格式”及其功能以进行检索。问题是他们不执行传统的OCR ...他们的OCR算法可能会为图像上的单个“单词”产生不同的单词。他们仅将其用于搜索,因此这对他们来说很好,但不适用于将其用作识别引擎。(尽管它们给您每个单词替代的权重,所以也许您可以使用它)
我不确定您需要多少复杂性,但是由于我也使用Adobe Acrobat,因此我只需右键单击Evernote附件即可使用Acrobat打开。
然后从Acrobat中选择“文档| OCR文本识别”,然后将文档另存为纯文本。
这对我来说效果很好,因为我只需要偶尔进行一次OCR转换。
我在Windows上并使用Adobe Acrobat Pro和Word,因此请执行以下操作: