什么是JPEG文本操作的最佳方法？

我有一个相对简单的图形; 一个包含各种文本的技术图表。

该文本使用其他语言（捷克语/斯洛伐克语）。它打印得足够清晰，可以通过（Android）Google Translate的OCR进行准确区分和解释。无论如何，我想用英文翻译替换文本。

在这种情况下，只是剪切/隐藏当前文本，然后使用基本编辑工具添加所有新文本框并不困难。但如果我只是简单地选择和编辑文本就可以了，就像某些PDF编辑器能够做到的那样。

我尝试将JPEG / PNG导出为PDF，然后使用Libre Office进行编辑。但是创建空白文档并插入图像也没有什么不同; 这只是一个单一的对象。

我理解为什么，我不指望魔法。但有没有人有这方面的技术？

— tjt263
source

基本上，你是否在询问是否有一个图形编辑程序有点OCR识别图形中的文本元素，并将它们转换为实际的可编辑文本？如果是这样，我就不知道了。文本不仅仅是文本，还有字体，字距调整，行间距以及所涉及的各种其他变量。听起来它会是一个非常酷的功能！

— 三明治

@Sandwich我使用的大多数PDF编辑器在某个阶段遇到了字体兼容性问题。特别是在从外国操作系统编辑文档时。它从来没有让我感到悲伤; 我总是设法将文本转换为本机字体。

— tjt263

但是，PDF比JPEG更“丰富”。PDF旨在允许从便携式文档进行高质量打印。因此，它们不仅经常包含用于图像的嵌入式JPEG，而且它们还可以存储图形的矢量数据，以及具有相应格式化指令和实际字体本身的文本数据 - 所有这些都隐藏在PDF文件本身中。这就是为什么许多PDF具有可复制和可搜索的文本。当没有基础文本数据时，OCR就是我们必须要求的 - 它试图从纯像素数据中找出字母。

— 三明治

最简单的方法（不看文档有多复杂）是使用DTP软件放置图像，锁定图像，然后添加具有白色背景的单个文本框。您将能够进行非常精确的放置，并且您可以简单地调整框的大小以覆盖旧文本。然后，您可以导出为PDF或平面图像格式。

Scribus是Quark或InDesign的免费开源DTP包。

Word等通常具有文本框的功能，但我发现这些与DTP软件相比很麻烦。

如果你足够清理图像，你可以尝试使用Inkscape（开源）或Illustrator来“跟踪”或“实时跟踪”图像，文本可能最终可编辑为非文本矢量对象，但这是可能会出现问题，即使这样也需要比放置新文本框更长的时间。

— Yorik
source