Questions tagged «character-encoding»

处理字符和字符集的各种表示形式的问题,例如:ASCII,UTF-8,EBCDIC等。在操作系统之间移动文件时经常会遇到这种情况,这些文件使用回车符和/或换行符对换行进行编码。

3
如何用纯UTF-8文本替换所有百分比编码的UTF-8子字符串?
我有一个HTML文件,URL中包含许多%编码的UTF-8文本。 例如,“%D1%80%D0%B5%D1%81%D1%83%D1%80%D1%81%D1%8B”代表“ресурсы”(俄语中的“资源”)。 任务是用可读的UTF-8文本替换所有此类子字符串。 为了简化任务,我们可以考虑%文件中没有其他符号使用。字母数字可以是大写和小写。 我怀疑这可以用优雅来完成sed,perl,awk或东西,但不知道怎么办。 该Web应用程序似乎可以解决您粘贴到此处的文本的问题。

2
同一文件,由于编码问题,文件名不同?
我正准备从源中比较备份,以手动验证数据是否正确。某些字符(例如åäö)未正确显示在原始数据上,但是由于客户端(通过samba)正确解释了这些字符,因此无需担心。从备份还原的数据正确显示了字符,导致差异不认为它们是相同的文件(具有差异,而是完全不同的文件)。 md5总和,相同文件但名称不同。 # md5sum /original/iStock_000003637083Large-barn* e37c34968dd145a0e25692e1cb7fbdb1 /original/iStock_000003637083Large-barn p? strand.jpg # md5sum /frombackup/iStock_000003637083Large-barn* e37c34968dd145a0e25692e1cb7fbdb1 /frombackup/iStock_000003637083Large-barn på strand.jpg 挂载选项和文件系统 /dev/sdb1 on /original type ext4 (rw,noatime,errors=remount-ro) /dev/sdc1 on /frombackup type ext4 (rw) 语言环境 LANG=sv_SE.UTF-8 LANGUAGE= LC_CTYPE="sv_SE.UTF-8" LC_NUMERIC="sv_SE.UTF-8" LC_TIME="sv_SE.UTF-8" LC_COLLATE="sv_SE.UTF-8" LC_MONETARY="sv_SE.UTF-8" LC_MESSAGES="sv_SE.UTF-8" LC_PAPER="sv_SE.UTF-8" LC_NAME="sv_SE.UTF-8" LC_ADDRESS="sv_SE.UTF-8" LC_TELEPHONE="sv_SE.UTF-8" LC_MEASUREMENT="sv_SE.UTF-8" LC_IDENTIFICATION="sv_SE.UTF-8" LC_ALL= od -c # ls "/original/iStock_000003637083Large-barn …

3
如何在远程Red Hat机器上正确显示汉字?
我正在使用Ubuntu14.04连接到远程主机。 它的版本是: Linux版本2.6.32-431.11.5.el6.yyyzzz.x86_64(gcc版本4.4.7 20120313(Red Hat 4.4.7-4)(GCC))#1 SMP 2014年7月3日星期四09:42:34 CST 我在那台机器上的上传文件无法正确显示中文字符。然后打开一个文件,用Ubuntu随机输入汉字ibus input method。它显示: ~R~V�~K~B~I~W个~I~N~T�饭~T~E 我在线搜索并尝试了以下2种方法: 1:检查语言环境 It shows: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC=en_US.UTF-8 LC_TIME=en_US.UTF-8 LC_COLLATE="en_US.UTF-8" LC_MONETARY=en_US.UTF-8 LC_MESSAGES="en_US.UTF-8" LC_PAPER=en_US.UTF-8 LC_NAME=en_US.UTF-8 LC_ADDRESS=en_US.UTF-8 LC_TELEPHONE=en_US.UTF-8 LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=en_US.UTF-8 LC_ALL= 好像没问题。 2:安装中文支持包 我做了: yum install "@Chinese Support" 它在该计算机上安装了178M个文件。 之后,我打开另一个文件,然后尝试使用ibus输入一些中文。但是问题仍然存在,如何解决呢? update1之后, 我做了更多研究。我发现可以正确键入一些字符(通过拼音输入法,ibus)。喜欢: 起 度 顿 客 它们都对应于拼音。但是每个字符后都有一个自动生成的空间(我没有键入)。 如果我尝试键入启,杜,盾,刻(它们的拼音与上述4个汉字相同)。我有: �~P�~]~\ ~[� …

2
终端:非英语字符
我曾经能够在控制台/终端中复制和粘贴(或键入(如果加载相应的键盘布局,则键入))任何种类的字符(例如éöñßو好)。 现在,我买了一台新电脑,它不再工作,只能使用英语/ ASCII字符(但是在其他程序中,例如firefox,它仍然可以工作)。 发行:Ubuntu。尝试使用的终端:gnome-terminal,xterm,konsole。 我尝试将/ etc / environment中的LANG设置为en_US.UTF-8,但重启后echo $LANG仍会给出C。我也尝试在gnome-terminal -menu中设置Character encoding为-没有效果。Unicode(UTF-8)Terminal 问题:如何获得能够处理非英文字符的终端?

1
如何在Bash中修复字符编码(Arch Linux)
我在bash中使用德国变音符号编码时遇到一些问题。它通常工作正常,但是当我键入无效命令时,bash生成的错误消息包含奇怪的转义序列,而不是实际字符。 这是显示问题的日志: [root@myhost ~]# mkdir ä [root@myhost ~]# ä -bash: $'\303\244': Kommando nicht gefunden. [root@myhost ~]# ü -bash: $'\303\274': Kommando nicht gefunden. [root@myhost ~]# ls ä äöü Projects tbb [root@myhost ~]# cat äöü äüö [root@myhost ~]# rm ä rm: Entfernen von „ä“ nicht möglich: Ist ein Verzeichnis [root@myhost ~]# rmdir …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.