Questions tagged «utf-8»

UTF-8是Unicode字符集的多字节字符编码,由一个或多个字节组成。与其他一些编码(例如UTF-16)不同,UTF-8编码与7位ASCII字符向上兼容,并且可以由仅了解字节的应用程序进行某种程度的处理。

5
如何使“ less”命令处理UTF-8?
在我的Mac终端上,通常可以打印UTF-8,但是less不能正常工作。 所以这可以正常工作: $ echo -e '\xe2\x82\xac' € 但是将其管道化成更少的内容是这样的: $ echo -e '\xe2\x82\xac' | less <E2><82><AC> 如何解决? 用于诊断: 我正在使用Mac OS 10.6.8。较少版本418,终端2.1.2(273.1)。 我的语言环境的输出是这样的: $ locale LANG="en_US.UTF-8" LC_COLLATE="C" LC_CTYPE="C" LC_MESSAGES="C" LC_MONETARY="C" LC_NUMERIC="C" LC_TIME="C" LC_ALL="C"

5
使用rsync或afpd将UTF-8 NFD文件名转换为UTF-8 NFC
我有一台运行FreeNAS 8的家庭文件服务器。几天前,我使用rsync从Mac上传了整个iTunes库,以便可以通过网络加载我的库,而不必使用慢速的USB驱动器。这通常可以正常工作,并且iTunes现在运行得更好,但是访问任何包含非ASCII字符的歌曲时遇到了问题(我在加载Queensrÿche曲目时首先注意到了这个问题)。这些文件将显示在Finder中,但是任何尝试访问它们的操作都会使它们消失,直到我重新连接到服务器为止。 经过研究后,我发现这是因为OSX使用与Linux不同的UTF字符顺序。OSX文件系统使用Unicode规范化形式D(NFD),而linux使用形式C(NFC)。当Rsync执行从我的mac到服务器的复制时,Rsync不会转换这些形式。现在,当iTunes尝试通过网络访问带有特殊字符的文件时,服务器上的文件编码错误,并且afpd报告不正确。不存在。 解决此问题的最佳方法是什么?在将基本库上传到服务器时,可以使rsync执行unicode转换吗?我可以配置afpd以NFD格式发送/接收文件名吗?有没有简单的解决方案来更改服务器上的文件名?我发现了有关名为convmv的程序的一些信息,但我不知道是否可以在FreeNAS上运行它。
24 mac-osx  rsync  freenas  utf-8  afp 




2
是否有MySQL性能基准来衡量utf8_unicode_ci与utf8_general_ci的影响?
我读到这里和那里,使用utf8_unicode_ci核对,确保更好的治疗Unicode文本(例如,它的已知,如何扩展字符,如“O E”到“OE”的搜索和排序)相比默认utf8_general_ci它基本上只是剥离变音符号。不幸的是,两个消息来源都表明该utf8_unicode_ci速度慢于utf8_general_ci。 所以我的问题是:“稍微慢一点”是什么意思?有没有人运行基准测试?我们是在谈论-0.01%的性能影响,或者说是-25%的影响? 谢谢你的帮助。

1
Ext3文件名是否限制为255个符号或255个字节?
我无法在Ext3文件系统上保存名称超过127个西里尔UTF-8符号的文件。可以这样保存,但最多包含255个英语UTF-8符号。 那么包含文件名的字节数或文件名中的字符数是否有限制?例如,对于前者,可能希望对中文的文件名长度有更严格的限制。那正确吗?
9 ext3  utf-8 

1
PuTTY可以配置为显示以下UTF-8字符吗?
我希望能够渲染此推文中显示的字符: 我保存了推文的JSON数据,并编写了一个单行python脚本进行测试。 python -c 'import json,urllib; print json.load(urllib.urlopen("http://c.sente.cc/BUCq/tweet.json"))["text"]' 下图显示了此命令在两个不同的腻子会话上的输出,一个使用Bitstream Vera Sans Mono字体,另一个使用Courier New: 接下来是正确输出的示例(我没有使用PuTTY): 原始JSON在此链接上使用Twitter的API。 如何获得腻子显示这些字符?

3
Lighttpd为UTF-8内容发送错误的标头
Ubuntu / Lighttpd无法使用正确的Content-Type标头提供我的UTF-8编码文件。它是发送Content-Type: text/html而不是Content-Type: text/html; charset=UTF-8。如何配置Lighttpd发送正确的标头? 我没有在默认设置中看到任何有用的设置,lighttpd.conf并且无法在文档中找到信息。
8 utf-8  lighttpd 

4
在Ubuntu中将文件系统编码更改为UTF-8
如何找出当前文件系统使用的字符集编码以及如何将其更改为UTF-8? 编辑: 这是mount的输出: /dev/sdb6 on / type ext3 (rw,relatime,errors=remount-ro) tmpfs on /lib/init/rw type tmpfs (rw,nosuid,mode=0755) /proc on /proc type proc (rw,noexec,nosuid,nodev) sysfs on /sys type sysfs (rw,noexec,nosuid,nodev) varrun on /var/run type tmpfs (rw,nosuid,mode=0755) varlock on /var/lock type tmpfs (rw,noexec,nosuid,nodev,mode=1777) udev on /dev type tmpfs (rw,mode=0755) tmpfs on /dev/shm type tmpfs …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.