Answers:
没有“ 该 标准编码“,你有 许多 他们
UTF-8 ,Unicode编码,是目前最常用的。 它是大多数Linux发行版的默认设置,也是其他平台上的许多电子邮件客户端。在Windows上,“Unicode”通常是指UTF-16,它只是同一个Unicode的另一种表示形式。
由于其局限性和无法在同一文件中使用多种语言,其他编码已逐渐被废弃。
他们中最“标准”的就是 ISO 8859 编码,主要是ISO 8859-1 为“西欧”。
其 Windows同行 非常相似;最常见的是 Windows的1252 又名 CP1252 ,ISO 8859-1的超集 。 (您的 CP1251 用于西里尔字母。)
另见a 字符编码列表 。
一个名为的Python脚本 chardet的 能够准确猜测给定文件使用的编码。
chardet
从Python交互模式很容易。 import chardet; data = open("myfile").read(); print chardet.detect(data)