Unix & Linux unicode

3

我收到了带有FF FEBOM 的.csv文件： $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| 当使用awk它解析时，我得到了一堆空字节，我怀疑这是由于字节顺序所致。如何交换该文件上的字节顺序（使用CLI），以便普通工具可以使用它？请注意，我认为该文件仅是ASCII字符（BOM除外），但是我不能确认grep它是二进制文件： $ grep -P '^[\x00-\x7f]' dotan.csv Binary file dotan.csv matches 在VIM中搜索相同的字符串会显示每个匹配的字符！使用iconv转换为ASCII不会摆脱\ x00值，实际上，这使问题变得更糟，因为它们现在看起来像空字节而不是UTF-8！ $ iconv -f UTF-8 -t ASCII dotan.csv > …

10 text-processing character-encoding unicode

3

如何用纯UTF-8文本替换所有百分比编码的UTF-8子字符串？

我有一个HTML文件，URL中包含许多％编码的UTF-8文本。例如，“％D1％80％D0％B5％D1％81％D1％83％D1％80％D1％81％D1％8B”代表“ресурсы”（俄语中的“资源”）。任务是用可读的UTF-8文本替换所有此类子字符串。为了简化任务，我们可以考虑%文件中没有其他符号使用。字母数字可以是大写和小写。我怀疑这可以用优雅来完成sed，perl，awk或东西，但不知道怎么办。该Web应用程序似乎可以解决您粘贴到此处的文本的问题。

9 text-processing character-encoding text unicode

4

是否有支持双向文本的终端仿真器？

我尝试搜索，但空手而归。我是否可以让终端仿真器正确显示从右到左的Unicode字素簇？用例：我正在编写一个脚本，将阿拉伯字母输出到终端，并且当前正在以相反的顺序输出字形，这弄乱了它们应该连接的方式，使它们在视觉上难以阅读。

9 unicode terminal-emulator

1

如何更改bash控制台字体以显示UTF-8字符

我在bash上正确显示UTF-8字符时遇到了一些麻烦。我试图提取一些压缩文件，这些文件的名称中包含重音字符，但出现无效的多字节字符错误。我.bash_profile用这个创建了一个： export LANG=en_US.UTF-8 export LOCALE=UTF-8 这样解决了提取问题。但是控制台仍然无法正确显示带重音符号的字符。Konqueror的重音字符没有问题。我需要做什么？

9 bash unicode

3

Mint 17（肉桂）：CTRL + Shift + U不允许我输入Unicode符号

我意识到这个问题可能有一个简单的答案。我来自Ubuntu（Unity），习惯用Ctrl+ Shift+ 键入unicode符号U，其后是符号的代码和Enter。这在Mint 17（肉桂）中似乎不起作用。我四处搜寻，没有找到答案。您如何输入unicode符号？

8 linux-mint keyboard-shortcuts cinnamon unicode

4

xterm不显示unicode

我从来没有能够让我的终端显示unicode符号。例如，在我拥有现在的操作系统之前，我将ctrl + a映射到vim中的希腊mu，并且它可以在其他计算机上运行，但不能在当前的xterm上运行。这是我的相关部分.vimrc： set encoding=utf-8 "map control-a to mu imap <C-a> <C-k>m* 另外，我需要在python中输出sympy方程，这在其他计算机上有效，但在我当前的xterm上不可用。代替这个： $ python Python 2.7.3 (default, Mar 14 2014, 11:57:14) [GCC 4.7.2] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import sympy >>> x = sympy.symbols('x') >>> sympy.init_printing() >>> (sympy.sqrt(x**3/(x+1)), 1) ⎛ _______ ⎞ …

8 xterm unicode

1

尽管它在ubuntu的/ etc / default / locale中支持unicode，但如何在语言环境中设置LANG？

我跑步了Ubuntu 12.04，我不能将地区设置为en_US.utf8。我设置了LANG通过配置/etc/default/locale描述这里。 $cat /etc/default/locale LANG=en_US.utf8 $locale LANG= LANGUAGE= LC_CTYPE="POSIX" LC_NUMERIC="POSIX" LC_TIME="POSIX" LC_COLLATE="POSIX" LC_MONETARY="POSIX" LC_MESSAGES="POSIX" LC_PAPER="POSIX" LC_NAME="POSIX" LC_ADDRESS="POSIX" LC_TELEPHONE="POSIX" LC_MEASUREMENT="POSIX" LC_IDENTIFICATION="POSIX" LC_ALL=POSIX 但是，如上所述，它不起作用。如何将此LANG变量设置为en_US.utf8？我问的原因是，当我运行时echo -e "\x03\bb"，可以unicode greek letter lambda symbol正确显示，但是我的问题是emacs。在emacs中，我无法显示unicode符号，例如：C-x 8 RET 03bboutputs \u03bb，而不是a greek letter lambda symbol。我认为问题出在这些语言环境设置，但我无法设置它们。编辑：我认为问题已解决。 $su $USER -c 'env; echo ==; locale' | egrep '==|LANG' LANG=en_US LANGUAGE=en_US …

8 ubuntu configuration emacs locale unicode

3

如何在远程Red Hat机器上正确显示汉字？

我正在使用Ubuntu14.04连接到远程主机。它的版本是： Linux版本2.6.32-431.11.5.el6.yyyzzz.x86_64（gcc版本4.4.7 20120313（Red Hat 4.4.7-4）（GCC））＃1 SMP 2014年7月3日星期四09:42:34 CST 我在那台机器上的上传文件无法正确显示中文字符。然后打开一个文件，用Ubuntu随机输入汉字ibus input method。它显示： ~R~V�~K~B~I~W个~I~N~T�饭~T~E 我在线搜索并尝试了以下2种方法： 1：检查语言环境 It shows: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC=en_US.UTF-8 LC_TIME=en_US.UTF-8 LC_COLLATE="en_US.UTF-8" LC_MONETARY=en_US.UTF-8 LC_MESSAGES="en_US.UTF-8" LC_PAPER=en_US.UTF-8 LC_NAME=en_US.UTF-8 LC_ADDRESS=en_US.UTF-8 LC_TELEPHONE=en_US.UTF-8 LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=en_US.UTF-8 LC_ALL= 好像没问题。 2：安装中文支持包我做了： yum install "@Chinese Support" 它在该计算机上安装了178M个文件。之后，我打开另一个文件，然后尝试使用ibus输入一些中文。但是问题仍然存在，如何解决呢？ update1之后，我做了更多研究。我发现可以正确键入一些字符（通过拼音输入法，ibus）。喜欢：起度顿客它们都对应于拼音。但是每个字符后都有一个自动生成的空间（我没有键入）。如果我尝试键入启，杜，盾，刻（它们的拼音与上述4个汉字相同）。我有： �~P�~]~\ ~[� …

8 character-encoding unicode input-method

1

ImageMagick（或其他），用于将UTF-8文本转换为图像

我正在尝试使用创建许多单字符图像convert。目的是为塑料专家提供可以打印到键盘键帽上的图像。在ImageMagick的文件显示是这样的： printf "\u2318" | convert -size 100x100 label:@- -font unifont-Medium command.png 要么 echo ⌘ | convert -size 100x100 label:@- -font unifont-Medium command.png 要么 convert -size 100x100 label:'⌘' -font unifont-Medium command.png 应该打印兴趣点符号，但会产生一个问号。我已经确认（使用charmap）unifont-Medium字体集实际上包括此字形。我知道我的系统上的其他字体也可以提供此字形，因为在安装unifont之前我可以看到它，但是我无法弄清它们的名字。我也尝试过使用LaTeX（例如，带有所有其他功能和utf8x软件包的TexLive ），但不支持任何特殊字符。论坛上有很多有关使用imagemagick和其他特殊字符打印汉字的问题...以下对我有用： convert -background lightblue -fill blue -pointsize 32 \ label:' é è à ù ç …

8 fonts unicode images imagemagick

1

以用户身份登录时失去unicode支持urxvt，root shell拥有它们

我正在进行最小的debian测试安装。我已经成立了rxvt-unicode，herbstluftwm和SLiM。使用我的用户名，在SLiM登录后，urxvt我启动的所有终端实例都缺乏Unicode支持。如果我这样做sudo urxvt，则新的urxvt实例在终端（以root用户身份）中显示unicode字符。这是虚拟机中的新安装。在设置SLiM之前，我以用户身份获得了unicode支持。之后的某个时候，我不再看到这些角色。这个问题似乎与这个问题非常相似，但是我看不到可以采取的任何类似措施。相关配置：瘦 default_path /usr/local/bin:/usr/bin:/bin:/usr/local/games:/usr/games default_xserver /usr/bin/X11/X xserver_arguments -nolisten tcp halt_cmd /sbin/shutdown -h now reboot_cmd /sbin/shutdown -r now console_cmd /usr/bin/xterm-C -fg white -bg black +sb -T "Console login" -e /bin/sh -c "/bin/cat /etc/issue.net; exec /bin/login" xauth_path /usr/bin/X11/xauth authfile /var/run/slim.auth numlock on # hidecursor false login_cmd …

3 login window-manager unicode rxvt display-manager

Questions tagged «unicode»