用hunspell正确显示非ASCII字符


1

我想使用hunspell命令行形式来拼写检查一些文本文件。这些文件是utf-8编码的,包含一些变音符号和其他奇怪的字符。

这样有些话出现

维尔拉〜_lich

代替这个

verläßlich

我告诉的hunspell读取文件作为UTF-8-i utf-8。我试图在gnome-terminal中切换编码。我在xterm和中尝试过xterm -u8没有成功

这不是字体问题,因为当我在终端中键入奇怪的字符时,它们显示的很好。

如何使奇怪的角色出现?

Answers:


1

您用来运行hunspell的命令是什么?

hunspell −d de_DE -i UTF-8 filename

如果那里没有运气

SET UTF-8

...应放在您的词缀文件中。在您的情况下,您的词缀文件可能是de_DE.aff。

如果未指定,则默认为

/usr/share/myspell/default.aff

希望这可以帮助!


我的词缀文件包含SET ISO8859-1,如果我将其更改为UTF-8,那么hunspell在开始拼写检查之前会给出很多错误。不同的消息,但其中大多数是:此UTF-8编码无法转换为UTF-16。我认为这是因为附加文件根本不是UTF-8。
路德维希·威尼泽尔

啊,我想这里有些混乱。在最初的问题中,您具有“文件是utf-8编码的”。如果ISO8859-1的错误最少,则可能是您想要的。无论如何,它当然应该支持德语。您可以将词缀文件的内容以及用于运行hunspell的确切命令发布到原始问题吗?谢谢!
RJFalconer
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.