Questions tagged «unicode»

Unicode是用于纯文本的计算机表示的标准。它包含通用字符集,旨在明确表示人类书写系统中使用的任何语言的所有字符,Unicode转换格式(UTF),定义用于存储和传输Unicode文本的标准化格式以及用于处理和操作文本的标准。

2
有没有一种方法可以通过安装特定字体来显示Unicode标志?如果是这样?
因此,我一直想知道区域指示器符号及其在手机系统中的使用。从理论上讲应该可以为计算机创建一种显示实际标志而不是占位符的字体,对吗? 前面提到的Wikipedia文章应提供足够的测试用例。我想有对子之类🇩🇪,🇬🇧或🇱🇻分析,并与他们相应的标志取代。 到目前为止,我找不到任何听起来像我想要达到的目标。
13 fonts  unicode 

1
iconv使用BOM生成UTF-16
受这个问题的启发,我可以使用该iconv命令生成具有BOM表和指定字节序的UTF-16输出吗? 该iconv命令将文本从一种编码转换为另一种编码。 例如: echo hello | iconv -f ascii -t utf-16 生成的UTF-16表示形式"hello\n"。 UTF-16文件通常但不总是以字节顺序标记(BOM)开头,它是Unicode字符的2字节编码U+FEFF。您可以通过检查前两个字节是FE FF还是来确定带有BOM的UTF-16文件的字节序FF FE。 该iconv命令具有用于生成UTF-16输出的几个选项: $ iconv --list | grep -i utf-16 UTF-16// UTF-16BE// UTF-16LE// 该命令: echo hello | iconv -f ascii -t utf-16be 生成没有BOM的 big-endian UTF-16 ;似乎假设如果指定了字节序,则无需在输出中指出。同样,utf-16le生成不带BOM的小端序UTF-16。 这个: echo hello | iconv -f ascii -t utf-16 生成(在我的x86 Ubuntu系统上)带有 …
11 unicode 

3
在bash上查看文件中所有字母的unicode代码点
我必须处理一个文件,其中包含许多不可见的控制字符,例如“从右到左”或“零宽度非连接符”,与正常空间不同的空间等等,而我在处理该文件时遇到了麻烦。 现在,我想以某种方式逐字母查看给定文件中的所有字母(我想说的是“从左到右”,但不幸的是,我正在处理从右到左的语言),作为Unicode代码点,仅使用基本的bash工具(如vi,less,cat...)。有可能吗? 我知道我可以用十六进制显示文件hexdump,但是我必须重新计算代码点。我真的很想查看实际的unicode代码点,因此我可以在Google上搜索它们并找出正在发生的情况。 编辑:我要补充一点,我不想将其转码为其他编码(因为这就是我在网上找到的内容)。我在UTF8中有文件,这很好。我只想知道所有字母的确切代码点。
11 linux  unicode 

3
查找任何字符的替代代码
有时,我在Internet上找到的alt代码无法在我的PC上运行,例如Pi alt代码(Alt+ 227)会抛出πte。 因此,我需要在剪贴板(或文件或任何地方)中使用该字符,并将其转换为与我的系统兼容的Alt代码。这可能吗?

4
永久修复了无法正确显示Unicode字符的问题(如方框所示)
在回复之前,请先阅读全文。 首先,我知道如何临时解决此问题。我正在寻找一个永久性的解决方案。我经常使用外语文件。 不幸的是,有时Windows资源管理器,记事本和其他位置(由Windows渲染,可能是GDI)中的所有unicode字符无法正确显示。它们显示为矩形块,之前它们一直在正确显示。有无数种方法可以临时纠正此问题。 但是,我再次想一种永久解决问题的方法。 我尝试过的 愚蠢的“根据语言设置隐藏字体”。此设置仅适用于您在字体文件夹和字体下拉菜单中看到的字体。它不会禁用外来字体(不起作用,或者如果起作用,则是临时的)。 删除字体缓存文件并重新启动(通常可以使用临时解决方案)。 更改我的语言环境然后再更改(有时可行,这是临时解决方案)。 重新启动我的电脑并很幸运(50-50次机会,临时解决方案)。 更改我的键盘输入/添加外来键盘(临时解决方案似乎只能使用一次)。 重新安装Windows(临时解决方案,有时可持续几个月,但是我已经在3台计算机上完成了7次)。 我还没有尝试过: 购买Windows Ultimate并安装接口包。这不是解决方案。我看不懂日语/中文,也不想使用这些语言的界面。 我不会做的: 切换到其他品牌的操作系统(Unix,Linux,Mac OS X)。 切换到Windows的旧版本(Vista,XP,2000等) 那么,有人可以推荐永久解决此问题吗?

1
Ubuntu Server中的Unicode字符
我最近从Ubuntu Desktop 13.04迁移到Ubuntu Server 13.10,现在我的文件系统似乎不支持Unicode字符。我使用rsync备份/同步文件,它显示正确的字符,但是它想删除不匹配的文件名并创建转义版本。 例如: root@ubuntu-server:~# rsync -avh --progress --delete --dry-run --exclude \$RECYCLE.BIN /media/source/ /media/target/ deleting Tiësto - Ten Seconds Before Sunrise.mp3 Ti\#353sto - Ten Seconds Before Sunrise.mp3 另外,如果我将unicode文件复制到文件系统,它将显示为: drwxr-xr-x 3 root root 4096 Jan 21 2013 DJ Ti?sto/ 我尝试通过安装unicode库,apt-get install unicode但就解决问题而言似乎没有做任何事情。 更新:现在这可能是内核问题。我正在通过samba / cifs复制,我尝试通过指定utf8字符集,mount -t cifs //192.xxx.xxx.xxx/source/ /media/target/ …

1
GNU sed(对于Windows)可以处理Unicode吗?如果是这样,是代码页/语言环境问题还是开关?
我已经使用GNU SED了两年了。有时它使我有点烦,但是它做得很好……对于单字节字符集! 我时不时注意到对GNU SED的引用是Unicode感知的,但是我所看到的最接近的是其“二进制”模式。而二进制不是Unicode。 GSED可以处理CodePoint分辨率的Unicode文本文件,尤其是\ r \ n(Windows)...,如果可以的话,它希望使用UTF-8,UTF-16还是什么?SED如何检测编码?
10 windows  encoding  unicode  sed  gnu 

7
Robocopy unilog输出乱码
我尝试在Windows 7中获取robocopy以生成Unicode日志,因为我具有带Unicode字符的文件。我使用的命令: robocopy C:\mysource D:\mydest /mir /unilog:backup.log /tee 文件复制正常且屏幕输出正确,日志文件本身仅包含乱码。不管我使用命令提示符还是Powershell。 是什么赋予了?难道我做错了什么?
10 unicode  robocopy 

3
使gvim显示unicode
如何获取GVim(如果重要的话,在Windows XP上为7.3版)显示Unicode字符?遵循以下原则 http://vimcasts.org/episodes/show-invisibles/ (搜索listchar以查看我尝试获得的小三角形)。 我在用着 set encoding, set fileencoding, and set fileencodings, 如果有帮助的话,请全部转换为utf-8。 我知道这一定是简单的事情,但尽管如此,我还是被困在这里。帮帮我。

2
更改Firefox文本文件的默认编码
文本文件不包含字符编码信息,因此Firefox无法知道哪个是正确的。通过菜单View→ Text encoding我可以选择适当的编码。我发现每次打开文本文件时都会这样做,因为默认情况下似乎总是将其设置为Western,但是我的文本文件始终是Unicode(UTF-8)。有什么方法可以将默认编码设置为Unicode而不是Western?

4
不能再使用Alt代码插入Unicode字符
一段时间以来,我一直在一些应用程序中使用省略号8230 的Alt代码。几天前,它停止工作,并&显示出来,而不是…在按Alt+ 8+ 2+ 3+ 0(在数字键盘上)时显示。这既发生在台式机上,也发生在笔记本电脑(与一起使用的地方Fn)上。两者都在代码页为850的64bit-Win-7上运行,并且都可能最近更新了Windows和Opera 12。 禁用此输入法的原因可能是什么,如何将其切换回去? 顺便说一句,我刚刚发现Alt+ 0+ 1+ 3+ 3不工作。另外我发现Alt+ 8+ 2+ 3+ 0仍然工作在写字板或MsWord10,但无论是在戏也不记事本++ -那里的字符代码插入之前转换系数256。

1
Ubuntu的ls可以显示unicode字符,但是tree不能显示,即使使用tree --charset unicode
Ubuntu 10.04 ls可以显示unicode字符,但tree即使使用tree --charset unicode或也不能显示utf8。有没有办法解决。 echo可以解释转义字符,但cat list.txt | echo -e不起作用(list.txt来自 tree > list.txt) 更新:tree -H www.somewhere.com可以输出unicode(应该是UTF-8),但是现在看来这是唯一的方法-作为网页。 $ ls -R .: list2.txt list.txt 久未在遊行場合露面的前總統李登輝.txt 遊行 ./遊行: 大家2.txt 大家.txt $ tree --charset unicode . |-- list2.txt |-- list.txt |-- \344\271\205\346\234\252\345\234\250\351\201\212\350\241\214\345\240\264\345\220\210\351\234\262\351\235\242\347\232\204\345\211\215\347\270\275\347\265\261\346\235\216\347\231\273\350\274\235.txt `-- \351\201\212\350\241\214 |-- \345\244\247\345\256\2662.txt `-- \345\244\247\345\256\266.txt 1 directory, 5 files $ tree …
10 ubuntu  bash  unicode  ls  tree 


3
从Ubuntu上的Font * .ttf文件获取受支持的Unicode范围
我的Ubuntu机器上有一些'ttf'格式的字体。 我想知道这些字体的一些元数据,关于那些字体文件支持哪些unicode范围和哪些非unicode代码页。 我该怎么办? 补充1:忘了提一下,我想获取数百种字体的那些信息,所以我需要某种可以自动实现的终端实用程序


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.