Questions tagged «unicode»

Unicode是一种计算行业标准,用于对世界上大多数书写系统中表示的文本进行一致的编码,表示和处理。

3
处理以BOM表(FF FE)开头的文件
我收到了带有FF FEBOM 的.csv文件: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| 当使用awk它解析时,我得到了一堆空字节,我怀疑这是由于字节顺序所致。如何交换该文件上的字节顺序(使用CLI),以便普通工具可以使用它? 请注意,我认为该文件仅是ASCII字符(BOM除外),但是我不能确认grep它是二进制文件: $ grep -P '^[\x00-\x7f]' dotan.csv Binary file dotan.csv matches 在VIM中搜索相同的字符串会显示每个匹配的字符! 使用iconv转换为ASCII不会摆脱\ x00值,实际上,这使问题变得更糟,因为它们现在看起来像空字节而不是UTF-8! $ iconv -f UTF-8 -t ASCII dotan.csv > …

3
如何用纯UTF-8文本替换所有百分比编码的UTF-8子字符串?
我有一个HTML文件,URL中包含许多%编码的UTF-8文本。 例如,“%D1%80%D0%B5%D1%81%D1%83%D1%80%D1%81%D1%8B”代表“ресурсы”(俄语中的“资源”)。 任务是用可读的UTF-8文本替换所有此类子字符串。 为了简化任务,我们可以考虑%文件中没有其他符号使用。字母数字可以是大写和小写。 我怀疑这可以用优雅来完成sed,perl,awk或东西,但不知道怎么办。 该Web应用程序似乎可以解决您粘贴到此处的文本的问题。

4
是否有支持双向文本的终端仿真器?
我尝试搜索,但空手而归。我是否可以让终端仿真器正确显示从右到左的Unicode字素簇? 用例:我正在编写一个脚本,将阿拉伯字母输出到终端,并且当前正在以相反的顺序输出字形,这弄乱了它们应该连接的方式,使它们在视觉上难以阅读。

1
如何更改bash控制台字体以显示UTF-8字符
我在bash上正确显示UTF-8字符时遇到了一些麻烦。我试图提取一些压缩文件,这些文件的名称中包含重音字符,但出现无效的多字节字符错误。我.bash_profile用这个创建了一个: export LANG=en_US.UTF-8 export LOCALE=UTF-8 这样解决了提取问题。但是控制台仍然无法正确显示带重音符号的字符。Konqueror的重音字符没有问题。我需要做什么?
9 bash  unicode 


4
xterm不显示unicode
我从来没有能够让我的终端显示unicode符号。例如,在我拥有现在的操作系统之前,我将ctrl + a映射到vim中的希腊mu,并且它可以在其他计算机上运行,​​但不能在当前的xterm上运行。这是我的相关部分.vimrc: set encoding=utf-8 "map control-a to mu imap <C-a> <C-k>m* 另外,我需要在python中输出sympy方程,这在其他计算机上有效,但在我当前的xterm上不可用。代替这个: $ python Python 2.7.3 (default, Mar 14 2014, 11:57:14) [GCC 4.7.2] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import sympy >>> x = sympy.symbols('x') >>> sympy.init_printing() >>> (sympy.sqrt(x**3/(x+1)), 1) ⎛ _______ ⎞ …
8 xterm  unicode 

1
尽管它在ubuntu的/ etc / default / locale中支持unicode,但如何在语言环境中设置LANG?
我跑步了Ubuntu 12.04,我不能将地区设置为en_US.utf8。我设置了LANG通过配置/etc/default/locale描述这里。 $cat /etc/default/locale LANG=en_US.utf8 $locale LANG= LANGUAGE= LC_CTYPE="POSIX" LC_NUMERIC="POSIX" LC_TIME="POSIX" LC_COLLATE="POSIX" LC_MONETARY="POSIX" LC_MESSAGES="POSIX" LC_PAPER="POSIX" LC_NAME="POSIX" LC_ADDRESS="POSIX" LC_TELEPHONE="POSIX" LC_MEASUREMENT="POSIX" LC_IDENTIFICATION="POSIX" LC_ALL=POSIX 但是,如上所述,它不起作用。如何将此LANG变量设置为en_US.utf8? 我问的原因是,当我运行时echo -e "\x03\bb",可以unicode greek letter lambda symbol正确显示,但是我的问题是emacs。在emacs中,我无法显示unicode符号,例如:C-x 8 RET 03bboutputs \u03bb,而不是a greek letter lambda symbol。我认为问题出在这些语言环境设置,但我无法设置它们。 编辑:我认为问题已解决。 $su $USER -c 'env; echo ==; locale' | egrep '==|LANG' LANG=en_US LANGUAGE=en_US …

3
如何在远程Red Hat机器上正确显示汉字?
我正在使用Ubuntu14.04连接到远程主机。 它的版本是: Linux版本2.6.32-431.11.5.el6.yyyzzz.x86_64(gcc版本4.4.7 20120313(Red Hat 4.4.7-4)(GCC))#1 SMP 2014年7月3日星期四09:42:34 CST 我在那台机器上的上传文件无法正确显示中文字符。然后打开一个文件,用Ubuntu随机输入汉字ibus input method。它显示: ~R~V�~K~B~I~W个~I~N~T�饭~T~E 我在线搜索并尝试了以下2种方法: 1:检查语言环境 It shows: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC=en_US.UTF-8 LC_TIME=en_US.UTF-8 LC_COLLATE="en_US.UTF-8" LC_MONETARY=en_US.UTF-8 LC_MESSAGES="en_US.UTF-8" LC_PAPER=en_US.UTF-8 LC_NAME=en_US.UTF-8 LC_ADDRESS=en_US.UTF-8 LC_TELEPHONE=en_US.UTF-8 LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=en_US.UTF-8 LC_ALL= 好像没问题。 2:安装中文支持包 我做了: yum install "@Chinese Support" 它在该计算机上安装了178M个文件。 之后,我打开另一个文件,然后尝试使用ibus输入一些中文。但是问题仍然存在,如何解决呢? update1之后, 我做了更多研究。我发现可以正确键入一些字符(通过拼音输入法,ibus)。喜欢: 起 度 顿 客 它们都对应于拼音。但是每个字符后都有一个自动生成的空间(我没有键入)。 如果我尝试键入启,杜,盾,刻(它们的拼音与上述4个汉字相同)。我有: �~P�~]~\ ~[� …

1
ImageMagick(或其他),用于将UTF-8文本转换为图像
我正在尝试使用创建许多单字符图像convert。目的是为塑料专家提供可以打印到键盘键帽上的图像。 在ImageMagick的文件显示是这样的: printf "\u2318" | convert -size 100x100 label:@- -font unifont-Medium command.png 要么 echo ⌘ | convert -size 100x100 label:@- -font unifont-Medium command.png 要么 convert -size 100x100 label:'⌘' -font unifont-Medium command.png 应该打印兴趣点符号,但会产生一个问号。 我已经确认(使用charmap)unifont-Medium字体集实际上包括此字形。我知道我的系统上的其他字体也可以提供此字形,因为在安装unifont之前我可以看到它,但是我无法弄清它们的名字。 我也尝试过使用LaTeX(例如,带有所有其他功能和utf8x软件包的TexLive ),但不支持任何特殊字符。 论坛上有很多有关使用imagemagick和其他特殊字符打印汉字的问题...以下对我有用: convert -background lightblue -fill blue -pointsize 32 \ label:' é è à ù ç …

1
以用户身份登录时失去unicode支持urxvt,root shell拥有它们
我正在进行最小的debian测试安装。我已经成立了rxvt-unicode,herbstluftwm和SLiM。 使用我的用户名,在SLiM登录后,urxvt我启动的所有终端实例都缺乏Unicode支持。 如果我这样做sudo urxvt,则新的urxvt实例在终端(以root用户身份)中显示unicode字符。 这是虚拟机中的新安装。在设置SLiM之前,我以用户身份获得了unicode支持。之后的某个时候,我不再看到这些角色。 这个问题似乎与这个问题非常相似,但是我看不到可以采取的任何类似措施。 相关配置: 瘦 default_path /usr/local/bin:/usr/bin:/bin:/usr/local/games:/usr/games default_xserver /usr/bin/X11/X xserver_arguments -nolisten tcp halt_cmd /sbin/shutdown -h now reboot_cmd /sbin/shutdown -r now console_cmd /usr/bin/xterm-C -fg white -bg black +sb -T "Console login" -e /bin/sh -c "/bin/cat /etc/issue.net; exec /bin/login" xauth_path /usr/bin/X11/xauth authfile /var/run/slim.auth numlock on # hidecursor false login_cmd …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.