Acrobat 11可以使用多个CPU内核进行OCR吗?


8

OCR处理需要时间。使用多个CPU核心可以加快处理速度。 Acrobat 10是 不是多线程应用程序 。 Acrobat 11怎么样?默认情况下11是否使用多个CPU核心(如果可用)进行OCR?如果没有,是否有任何解决方法,例如脚本,以帮助使Acrobat 11使用多个CPU核心进行OCR?通过Acrobat的内置脚本语言或使用外部脚本启动和指导Acrobat的多个单线程实例,与处理作业的各个部分并行。

注意:这个问题不是太局部化(不限于特定的时刻)因为(1)Adobe不经常发布新的主要Acrobat版本(Acrobat 10在两年前发布)和(2)Adobe Acrobat是一个广泛的二手应用。

Answers:


6

我安装了 Acrobat 11(XI)试用版 在VirtualBox中。 Acrobat 11是单线程的。

我还创建了一个外部脚本,启动多个Acrobat实例(每个CPU核心一个),并行处理OCR作业并合并结果。关键步骤是打开Acrobat首选项中的错误日志记录,解析所有.log并重新处理任何错误文件。该脚本(使用4个内核时)仍然比Acrobat 11默认的OCR快两倍。


3
您可以根据需要提供来源。如果他们敢于移除它,它可以很容易地恢复。
Joey

此外,如果您恰好是发布问题的同一人,请考虑将您当前未注册的帐户合并到新注册的帐户中。你可以开始了 这里 ,还读 这个 欲获得更多信息。之后,您将能够根据需要修改您的问题。
Indrek

我不想阻挠任何事情。因为您不断切换用户名,所以您的编辑似乎是由第三方进行的,他们似乎并不理解原始问题。此外,如果您想回答自己的问题,您应该立即写下问题并回答。
Isaac Rabinovitch

我现在已合并你的(未注册)帐户。但是,我们会要求您不要使用一次性电子邮件地址,而是在我们的网站上注册,以便您可以保持登录状态,评论您的问题等等。此外,没有什么会被删除,没有什么可担心的。请注意,始终会更严格地审核匿名编辑。
slhck

@IsaacRabinovitch,也许OP在发布后没有意识到答案?此外,新用户无法在发布后的8小时内回答他们的问题,除非他们具有一定的声誉级别。
slhck

1

多线程需要内置到应用程序中。开发人员必须编写创建线程的代码,并将任务分解为可分配给每个线程的子任务。如果Acrobat的开发人员无法为其OCR识别代码执行此操作,则用户无法创建所需的额外逻辑。


2
如果它可以应用于页面范围,您可能会尝试将工作分成多个进程,每个进程只需几页,然后将结果合并在一起。
Joey

0

要将所有核心用于OCR,您可能需要查看PDF-Exchange编辑器。它的OCR引擎似乎使用了我系统上的所有核心。一旦达到这种性能水平,使用SSD就有意义了。

必须有一个Windows调整,这将导致它将更多的CPU时间专用于不受I / O限制的单线程应用程序。在我的系统上,Acrobat没有因磁盘性能而减慢,但是我建立索引的CPU时间最多只有30%左右。

让我们面对现实,Acrobat是一个广泛使用但写得不好的应用程序。 Acrobat Pro具有一些您仍然无法在其他任何地方获得的功能。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.