Questions tagged «unicode»

Unicode是用于纯文本的计算机表示的标准。它包含通用字符集,旨在明确表示人类书写系统中使用的任何语言的所有字符,Unicode转换格式(UTF),定义用于存储和传输Unicode文本的标准化格式以及用于处理和操作文本的标准。

3
Vim:如何处理具有多种(两种以上)语言文本的Unicode文件?
我需要在Vim / gVim中设置哪些设置才能查看包含多种语言文本的Unicode文本文件? 您可以做出以下假设: 语言数量超过两种。 一些语言是中文,日文和韩文。 如果可以在gVim中查看这些文件(不一定是Vim)就足够了。 在Windows上运行的gVim 7.0。 这是一个文本示例,将其保存为Unicode时可以在记事本中很好地打开,但在gVim中显示为乱码: This is English. 这是中文。 これは日本です。 한국입니다. ಇದು ಕನ್ನಡ.
9 vim  unicode 

2
在许多大型网站上都没有显示几个Unicode字符(例如:⁠)
我只是将几个Unicode特征视为方框。这仅在Chrome中发生。字符编码设置为UTF-8,但是自动检测无济于事。 范例: [⁠] 你只会看到两个方括号,但实际上有Unicode字符世界乔伊纳之间。这是一个零宽度的不间断空间。 我还整理了一个jsfiddle演示。我看不到“ 世界细木工”角色,但可以看到“ 头发空间”。(看到它实际上是我没看到它。您知道吗?) 当人们发布一些新的表情符号等时,也会发生这种情况。 我怎样才能解决这个问题? 更新: 这种情况无处不在(Twitter,Facebook,随便命名)。我没有使用特殊字体,或者在我的系统(Windows 7、64位)上更改了一些与字体相关的内容。我以为这应该工作就错了吗? 更新2: 这让我发疯。仍然有太多未显示的字符。 示例(包装好的礼物):🎁 如您所见,Chrome默认不显示该字符。仅当我将字体显式设置为Segoe UI Symbol时,它才会这样做。Chrome为什么不自动将字体用作备用字体? 如何使Chrome识别Segoe UI Symbol字体?


2
如何在命令提示符下查看unicode字符
我在超级用户上阅读了这篇关于如何UTF-8在Windows命令提示符下查看字符的帖子。我尝试了答案中的步骤: Start -> Run -> regedit 去 [HKEY_LOCAL_MACHINE\Software\Microsoft\Command Processor\Autorun] 将值更改为 chcp 65001 我到达命令处理器,但后来我没有看到自动运行。 我添加了截图: 现在我该怎么做 ?我选择的字体cmd是Lucida Console。我想在命令提示符下看到Unicode字符。就像我必须测试一些包含乌尔都语文本的程序一样。我得到问号或其他一些文字来代替原文。 注意:我使用的是32位操作系统

1
Unicode字符在KDE中和Arch Linux中的控制台上显示不正确
我最近从OpenSuSE切换到Arch Linux。名称中带有unicode字符的文件通常可以正常显示,但是切换后,我得到的只是mojibake。例如,在我的音乐库中,Queensrÿche显示为Queensrèche。 这也在控制台上发生。 我在Arch Linux论坛上讨论了一个相关的话题,但是还没有得到答案。
6 linux  unicode  kde-4 

2
如何在记事本++ط(\ uFEC1和仅该字符)中找到此字符(通过unicode搜索)
如何在notepad ++ط中找到这个字符(通过unicode搜索) 如果我去charmap 我选这个角色 我在unicode搜索框中键入FEC1,然后按ENTER键,它会找到该字符 我在fileformat.info上查找 http://www.fileformat.info/info/unicode/char/fec1/index.htm UTF-8 (hex) 0xEF 0xBB 0x81 (efbb81) UTF-16 (hex) 0xFEC1 (fec1) 如果我按字面意思将字符输入搜索框,那么它就会找到它 但我无法看到要搜索的unicode 我希望能够在UTF-8和UTF-16中搜索它 [\ uFEC1]似乎找到了这个角色,但它找到的不仅仅是那个角色 现在,如果我在那里抛出几个FEC9,那么我看到[\ uFEC1]似乎也找到了它们 那么,我如何搜索\ uFEC1并且只搜索那个。而且我也有兴趣通过它的UTF-8代码来搜索它


1
如何阻止Windows 10计算器将复制的文本括在202D和202C Unicode字符中?
如果我使用Windows 10计算器复制其生成的值之一: 它复制到剪贴板的内容是用这两个Unicode括起来的文本 特点: '左右覆盖'(U + 202D) 在左边,和 'POP定向格式'(U + 202C) 在右边。 如果我把它粘贴到我的目标程序中,这些会搞砸我 只需要ASCII文本(就像编程语言编辑器一样。) 所以我想知道,如果有一个设置来阻止计算器 添加那些字符?

3
使用AutoHotKey轻松键入Unicode字符?
例如,我希望能够→使用AutoHotKey的文本替换功能键入(向右箭头),这就是我的脚本的样子: ::|rarr::{ASC 2192} 因此,当我|rarr在文本编辑器中键入内容并按, . <SPACE> <ENTER>等等时,应将文本替换为→。但由于某些原因,我得到这样的:É。 通常适用于ASCII和ANSI字符。使用Unicode是否应该以其他方式完成?如果是这样,怎么办?

2
如何在LibreOffice writer中获取其他语言的页码?
我试图在LibreOffice writer中获得非英语的页码。具体来说,我需要孟加拉语(孟加拉语)中的页码。 首先,我尝试更改字体。我发现插入的辅助文本(如Page)设置为所需的语言,但字段Page Number和Page Count仍为英语。见下文, 然后我尝试了另一种方法。我试图插入某些页面字段。我单击, Insert->Fields->Other然后Page从类型列表中选择。它给了我这样的清单, 我看到有许多非英语语言的条目。但是孟加拉人不是其中之一。 我猜想,如果我可以在最右边将条目添加到此列表中,我将获得所需的页码。 但是这种方法在这一点上也迷失了方向。 我已经为LibreOffice 安装了孟加拉语语言包。那里没有运气。 没有找到像什么这样,因为在MS Word中的LibreOffice。请参阅第一个评论。 如果能给我其他建议,我将不胜感激。 我了解您不需要知道孟加拉数字的样子。如果需要,此图像将为您提供想法。编号遵循阿拉伯语系统,但是符号与英语不同。

2
Word不会按预期转换非Unicode字符
对于MS Word(在Windows中)如何处理非unicode字符,我们的用户遇到了一个非常令人沮丧的问题。使用Windows XP SP3在Word 2007和Word 2010 Beta中都确认了此问题; 我怀疑它在2003年的工作方式相同。 问题: 用户使用非unicode字体创建文档,输入字符以表示科学记数法。例如,他输入Mu(μ)。注意:我粘贴在符合unicode标准的Mu中以供参考。 用户打开他的文档并尝试将表示Mu的非unicode字符复制/粘贴到Web浏览器中以进入我们的系统。它作为一个无法识别的角色粘贴。这是预料之中的。 用户打开他的文档,选择非unicode字符并将其字体调整为“Arial Unicode MS”,保存文档。他关闭/重新打开文件以获得良好的衡量标准。重新打开后,他会复制应该是unicode Mu并将其粘贴到Web浏览器中。它仍然表现为一个无法识别的角色。 用户创建一个新文档,将字体设置为“Arial Unciode MS”并创建一个Mu。他将此Mu复制到Web浏览器中,并按预期粘贴在Unicode中。 结论: 当选择unicode字体时,Word实际上不会将非unicode字符转换为unicode字符。相反,它是出于显示原因采取最佳猜测,但没有进行实际转换。 我该如何克服这个问题? 我可以更改Word中的某些设置以强制转换吗?优选的。 是否有一个“更干净”的应用程序或Word宏将执行此操作? 其他方案? 补充说明: 使用unicode重新键入受影响的文档不是一种选择 在使用最新版本的Word的Mac OS X中,这不是问题。例如(3)中的示例情况导致将unicode Mu粘贴到浏览器中。 请帮忙!

0
发布使用Curl发布的SOAP包装的XML导致无效的XML字符被发现异常
使用curl发送XML文件会导致: Invalid XML character (Unicode : 0x<integer>) 尝试解决问题 根据这个SO答案,如果XML版本更改为1.1,问题将得到解决。 虽然已更新驻留在XML文件中的版本: <?xml version="1.1" encoding="utf-8" standalone="yes"?> curl似乎继续将XML作为1.0版发送。 第二次尝试解决问题 另一种尝试是更改使用curl发布时使用的标头,如下所示: curl -X POST -H "Content-Type: text/xml; charset=utf-8; version=1.1" Curl似乎忽略了这一点,因为输出表明使用了xml版本1.0: * Closing connection #0 <?xml version="1.0" encoding="utf-8"?><soapenv:Envelope 第三次尝试解决问题 @Ƭᴇcʜιᴇ007建议创建一个小的XML文件: <?xml version="1.0" encoding="utf-8" standalone="yes"?> <soap:Envelope xmlns:soap="http://www.w3.org/2001/12/soap-envelope" soap:encodingStyle="http://www.w3.org/2001/12/soap-encoding"> <soap:Body> <note> <to>Test</to> </note> </soap:Body> </soap:Envelope> 验证语法并随后发布: An …
2 unicode  curl  xml  post 

0
当俄语布局处于活动状态时,如何在Linux中键入特殊字符?
在Linux中键入特殊unicode字符的方法是按Ctrl + Shift + u,然后键入字符编号。 但是当俄语布局处于活动状态时,此方法不起作用。因此,如果我输入俄语并且我想输入一个特殊的unicode字符,我必须切换到英文布局然后键入字符,然后切换回俄语布局。 有没有办法Ctrl + Shift + u在俄罗斯布局工作?

1
如何在Calibre中禁用库书籍文件名音译?
每当我通过Calibre电子书管理器库导入书籍时,它会将名称/标题转换为英语,删除欧洲单词的所有重音并用其罗马语替换非拉丁语(例如俄语)单词。 在今天的Unicode世界中没有技术上的必要性,它也损害了可用性,因为如果你能够流利地阅读(和搜索)其原始脚本中的单词而不是罗马化,那么它总是更容易阅读(并且我很明显)我能够精通所有我读过书的语言。 该Preferences - Saving books to disk - Convert non-English characters to English equivalents复选框允许您为书籍导出关闭此选项,但它仍将罗马化本地库和读取器设备库中所有文件的名称。 如何为库文件名关闭罗马化?

0
在VIM中显示软连字符
如何在Ubuntu 14.04下获得(G)VIM以在UTF-8编码的文本文件中显示软连字符? 在encoding和fileenconding设置都设置为utf-8,像德国的变音(AOU)字符正确显示。但是,代替软连字符(Unicode 00ad,html ­),我只看到期望减号的空白。我已经尝试了各种设置guifont,但是Anonymous Pro Minus,Courier New和Liberation Mono似乎都无法解决问题。相同的字体可以很好地用于jEdit。
2 vim  fonts  unicode 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.