Questions tagged «natural-language»

5
将UTF-8文件转换为ASCII(尽力而为)
我有一个UTF-8文件,其中包含多种语言的文本。其中很多是人们的名字。我需要将其转换为ASCII,并且我需要结果看起来尽可能体面。 有多种方法可以实现从较宽编码到较窄编码的转换。最简单的转换是将所有非ASCII字符替换为某个占位符,例如“ _”。如果我知道文件所用的语言,则还有其他可能性,例如罗马化。 Unix上可用的哪种Unix工具或编程语言库可以使我从UTF-8到ASCII的转换(尽力而为)? 大部分文本使用基于欧洲拉丁语的语言。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.