我有一个相对简单的图形; 一个包含各种文本的技术图表。
该文本使用其他语言(捷克语/斯洛伐克语)。它打印得足够清晰,可以通过(Android)Google Translate的OCR进行准确区分和解释。无论如何,我想用英文翻译替换文本。
在这种情况下,只是剪切/隐藏当前文本,然后使用基本编辑工具添加所有新文本框并不困难。但如果我只是简单地选择和编辑文本就可以了,就像某些PDF编辑器能够做到的那样。
我尝试将JPEG / PNG导出为PDF,然后使用Libre Office进行编辑。但是创建空白文档并插入图像也没有什么不同; 这只是一个单一的对象。
我理解为什么,我不指望魔法。但有没有人有这方面的技术?
基本上,你是否在询问是否有一个图形编辑程序有点OCR识别图形中的文本元素,并将它们转换为实际的可编辑文本?如果是这样,我就不知道了。文本不仅仅是文本,还有字体,字距调整,行间距以及所涉及的各种其他变量。听起来它会是一个非常酷的功能!
—
三明治
@Sandwich我使用的大多数PDF编辑器在某个阶段遇到了字体兼容性问题。特别是在从外国操作系统编辑文档时。它从来没有让我感到悲伤; 我总是设法将文本转换为本机字体。
—
tjt263
但是,PDF比JPEG更“丰富”。PDF旨在允许从便携式文档进行高质量打印。因此,它们不仅经常包含用于图像的嵌入式JPEG,而且它们还可以存储图形的矢量数据,以及具有相应格式化指令和实际字体本身的文本数据 - 所有这些都隐藏在PDF文件本身中。这就是为什么许多PDF具有可复制和可搜索的文本。当没有基础文本数据时,OCR就是我们必须要求的 - 它试图从纯像素数据中找出字母。
—
三明治