Questions tagged «text-encoding»

8
为什么会有多种Unicode编码?
我认为Unicode旨在解决由于大多数先前尝试(ASCII等)中的地址空间较小(8位)而导致具有许多不同编码的整个问题。 为什么会有那么多Unicode编码?甚至是(基本上)同一版本的多个版本,例如UTF-8,UTF-16等。

4
为什么UTF-8在其编码中浪费了几位
根据Wikipedia的文章,UTF-8具有以下格式: 首码尾码字节字节1字节2字节3字节4 点点使用 U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx 10xxxxxx U + 10000 U + 1FFFFF 4 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx x表示该位用于选择代码点。 这在每个连续字节上浪费了两位,而在第一个字节上浪费了一位。为什么未对UTF-8进行以下编码? 首码尾码字节字节1字节2字节3 点点使用 U + 0000 U + …

4
我可以使用哪种类型的编码来缩短字符串?
我对编码我拥有的字符串感兴趣,并且我很好奇是否存在可以使用的编码类型,该编码类型仅包括字母和数字字符,并且最好缩短表示该字符串所需的字符数。 到目前为止,我已经研究过使用Base64编码执行此操作,但是它似乎使我的字符串更长,有时包括==我想避免的字符串。例: 测试名称| 120101 变成 dGVzdCBuYW1lfDEyMDEwMQ == 长度从16到24个字符,并且包含非字母数字。 有人知道我可以使用满足我要求的其他编码类型吗?奖励点在于它是内置在.NET框架中还是存在将进行编码的第三方库。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.