今天的操作系统有哪些标准编码?


1

Mac,Unix和其他软件的标准编码是什么?

我知道,如果我使用Windows的朋友给我发送了一个文件,那么它很可能会被编码 cp1251。所以 emacs, 我可以: revert-buffer-coding-system 并会选择 cp1251

Answers:


7

没有“ 标准编码“,你有 许多 他们

UTF-8 ,Unicode编码,是目前最常用的。 它是大多数Linux发行版的默认设置,也是其他平台上的许多电子邮件客户端。在Windows上,“Unicode”通常是指UTF-16,它只是同一个Unicode的另一种表示形式。

由于其局限性和无法在同一文件中使用多种语言,其他编码已逐渐被废弃。

  • 他们中最“标准”的就是 ISO 8859 编码,主要是ISO 8859-1 为“西欧”。

  • Windows同行 非常相似;最常见的是 Windows的1252 又名 CP1252 ,ISO 8859-1的超集 。 (您的 CP1251 用于西里尔字母。)

  • 还使用其他编码,例如KOI8-R和Shift-JIS。

另见a 字符编码列表

一个名为的Python脚本 chardet的 能够准确猜测给定文件使用的编码。


1
UTF-8是OSX的默认设置
Mark

@grawity:看起来chardet没有CLI界面。真的吗?
Adobe

@Adobe:是的,但是使用 chardet 从Python交互模式很容易。 import chardet; data = open("myfile").read(); print chardet.detect(data)
grawity

@grawity:谢谢 - 使用你的解决方案我已经把它变成了一个python脚本 - 所以现在它有一个CLI界面。我把脚本放了 这里 。好了 - 再次感谢 - 拥有这样一种能够自动找出编码的能力真是太棒了。
Adobe
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.