什么是JPEG文本操作的最佳方法?


2

我有一个相对简单的图形; 一个包含各种文本的技术图表。

该文本使用其他语言(捷克语/斯洛伐克语)。它打印得足够清晰,可以通过(Android)Google Translate的OCR进行准确区分和解释。无论如何,我想用英文翻译替换文本。

在这种情况下,只是剪切/隐藏当前文本,然后使用基本编辑工具添加所有新文本框并不困难。但如果我只是简单地选择和编辑文本就可以了,就像某些PDF编辑器能够做到的那样。

我尝试将JPEG / PNG导出为PDF,然后使用Libre Office进行编辑。但是创建空白文档并插入图像也没有什么不同; 这只是一个单一的对象。

我理解为什么,我不指望魔法。但有没有人有这方面的技术?


基本上,你是否在询问是否有一个图形编辑程序有点OCR识别图形中的文本元素,并将它们转换为实际的可编辑文本?如果是这样,我就不知道了。文本不仅仅是文本,还有字体,字距调整,行间距以及所涉及的各种其他变量。听起来它会是一个非常酷的功能!
三明治

@Sandwich我使用的大多数PDF编辑器在某个阶段遇到了字体兼容性问题。特别是在从外国操作系统编辑文档时。它从来没有让我感到悲伤; 我总是设法将文本转换为本机字体。
tjt263

但是,PDF比JPEG更“丰富”。PDF旨在允许从便携式文档进行高质量打印。因此,它们不仅经常包含用于图像的嵌入式JPEG,而且它们还可以存储图形的矢量数据,以及具有相应格式化指令和实际字体本身的文本数据 - 所有这些都隐藏在PDF文件本身中。这就是为什么许多PDF具有可复制和可搜索的文本。当没有基础文本数据时,OCR就是我们必须要求的 - 它试图从纯像素数据中找出字母。
三明治

Answers:


2

最简单的方法(不看文档有多复杂)是使用DTP软件放置图像,锁定图像,然后添加具有白色背景的单个文本框。您将能够进行非常精确的放置,并且您可以简单地调整框的大小以覆盖旧文本。然后,您可以导出为PDF或平面图像格式。

Scribus是Quark或InDesign的免费开源DTP包。

Word等通常具有文本框的功能,但我发现这些与DTP软件相比很麻烦。

如果你足够清理图像,你可以尝试使用Inkscape(开源)或Illustrator来“跟踪”或“实时跟踪”图像,文本可能最终可编辑为非文本矢量对象,但这是可能会出现问题,即使这样也需要比放置新文本框更长的时间。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.