Questions tagged «character-encoding»

字符编码是指将字符表示为一系列字节的方式。Web的字符编码在编码标准中定义。


5
UTF-16的意义是什么?
我从不了解UTF-16编码的要点。如果您需要能够将字符串视为随机访问(即代码点与代码单元相同),则您需要UTF-32,因为UTF-16的长度仍然可变。如果您不需要它,那么与UTF-8相比,UTF-16似乎是对空间的巨大浪费。与UTF-8和UTF-32相比,UTF-16有何优势?为什么Windows和Java将其用作本机编码?

6
如何在PHP中替换Microsoft编码的引号
“ ” ‘ ’由于我的应用程序中存在编码问题,我需要用常规引号('和“)替换Microsoft Word的单引号和双引号()版本。我不需要它们成为HTML实体,也无法更改数据库架构。 我有两个选择:使用正则表达式或关联的数组。 有一个更好的方法吗?


9
获取Python可以编码为的所有编码的列表
我正在编写一个脚本,尝试在Python 2.6中尝试将字节编码为许多不同的编码。有什么方法可以获取可供迭代的可用编码列表? 我尝试执行此操作的原因是因为用户的某些文本编码不正确。有有趣的人物。我知道将它弄乱的Unicode字符。我希望能够给他们一个答案,例如“您的文本编辑器将该字符串解释为X编码,而不是Y编码”。我以为我会尝试使用一种编码对该字符进行编码,然后使用另一种编码再次对其进行解码,然后看看我们是否得到相同的字符序列。 即是这样的: for encoding1, encoding2 in itertools.permutation(encodinglist(), 2): try: unicode_string = my_unicode_character.encode(encoding1).decode(encoding2) except: pass

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.