从PDF复制汉字


4

我在Windows 7笔记本电脑上,我认为它预装了所有语言包。我可以看到没有问题的汉字,通常可以复制它们。(从浏览器到Microsoft Office效果很好)。我有许多带有中文字符的PDF - 每当我尝试将它们复制并粘贴到另一个程序(例如浏览器,Microsoft Office等)时,我只会得到奇怪的外来字符,例如:

,ôt¯ıngwoshu¯o听我说

这是复制一行。按顺序排列:汉字,拼音(拉丁字母中的中文),然后是英文翻译。

由于每个字母的音调标记(重音符号)正在移动到他们自己的空间,因此拼音也变得混乱。

任何想法如何解决这一问题?


PDF上的权限是什么?你可以编辑文本吗?
wizlog

我有一个中文PDF,我无法使用Adobe Reader复制和粘贴字符。然而,我通过在Adobe Acrobat Professional中打开PDF而不是在Reader中找到了成功。
skibulk

Answers:


2

从我在示例文本中看到的内容,PDF文件不包含中文文本的Unicode表示。相反,它可能使用特殊的嵌入字体来表示汉字和普通字体来表示汉语拼音拼音:

,ôt¯ıngwoshu¯o

应该

听我说tīngwǒshuō

我希望你看到变音符号(t īng w ǒshu ō)只是由几个相互叠加的字符构成,而表意文字根本没有显示。而不是U+01D2ǒU+02C7ˇo

您可以通过下载和播放此文件轻松检查是否可以复制和粘贴存储为Unicode的中文标志。这是一个正确的Unicode PDF,我在Windows 7 Professional系统(德语MUI)上复制和粘贴Unicode感知应用程序之间的字符没有问题。

如果这不起作用,则必须在系统上安装对中文字体的支持。

如果它有效,那么您可以通过检查PDF文件并查找嵌入字体来找到解决方法。尝试在互联网上找到这些字体并将它们安装在您的系统上 - 然后您将看到的不仅仅是一些毫无意义的迹象。然而,这仅适用于原始的中国标志; 拼音无法获救。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.