Questions tagged «surrogate-pairs»


3
实际使用中最常见的非BMP Unicode字符是什么?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 6年前关闭。 改善这个问题 根据您的经验,到目前为止,哪些BUnicode(基本多语言平面)之外的Unicode字符,代码点和范围是最常见的?这些是在UTF-8中需要4个字节或在UTF-16中需要替代的字节。 我希望答案是名称中使用的中文和日文字符,但不包括在最广泛的CJK多字节字符集中,但是在我最忙的项目中,英语维基词典中,我们发现哥特字母是到目前为止更普遍。 更新 我编写了一些软件工具来扫描整个Wikipedia中的非BMP字符,令我惊讶的是,即使在日语Wikipedia中,哥特字母也是最常见的。在中文维基百科中也是如此,但也有许多中文字符被使用多达50或70次,包括“𨭎”,“𠬠”和“𩷶”。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.