Questions tagged «unicode»

Unicode是用于文本编码,表示和处理的标准,旨在支持包含所有书写系统,技术符号和标点符号的书写文本所需的所有字符。


11
如何在Python中按字母顺序对unicode字符串排序?
Python默认情况下按字节值排序,这意味着é在z和其他同样有趣的事情之后。在Python中按字母顺序排序的最佳方法是什么? 有图书馆吗?我什么都找不到。最好是排序应该有语言支持,因此它理解åäö应该用瑞典语在z之后排序,但是ü应该用u进行排序,依此类推。因此,Unicode支持非常必要。 如果没有它的库,什么是最好的方法?只需将字母映射到整数值,然后将字符串映射到整数列表?




10
如何比较“相似”的Unicode字符?
我陷入一个令人惊讶的问题。 我在应用程序中加载了一个文本文件,并且有一些逻辑比较具有µ的值。 我意识到即使文本相同,比较值也是错误的。 Console.WriteLine("μ".Equals("µ")); // returns false Console.WriteLine("µ".Equals("µ")); // return true 在后面的行中,字符µ被复制粘贴。 但是,这些可能不是唯一的类似字符。 C#中有什么方法可以比较看起来相同但实际上不同的字符?

3
如何在TextView中通过Unicode设置表情符号?
嗨,我想做以下事情: ??? unicode = U+1F60A String emoji = getEmojiByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); 在我的textview中得到这个: 很高兴happy 我该如何实施getEmojiByUnicode(unicode)? unicode变量应为哪种类型?(字符串,字符,整数?) 请注意,我不想使用Drawables!



4
这些Unicode组合字符有什么作用,我们如何过滤它们?
ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็ก้้้้้้้้้้้้้้้้้้้้ก้้้้้้้้้้้้้้้้้้้้กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก้้้้้้้้้้้้้้้้้้้้กิิิิิิิิิิิิิิิิิิิิ 这些最近出现在Facebook的评论部分。 我们该如何消毒呢?


13
Java与产生相同输出的JavaScript的encodeURIComponent等效吗?
我一直在尝试各种Java代码,试图提出一些将对包含引号,空格和“奇异” Unicode字符的字符串进行编码的东西,并产生与JavaScript的encodeURIComponent函数相同的输出。 我的酷刑测试字符串是:“ A” B±“ 如果我在Firebug中输入以下JavaScript语句: encodeURIComponent('"A" B ± "'); —然后我得到: "%22A%22%20B%20%C2%B1%20%22" 这是我的小测试Java程序: import java.io.UnsupportedEncodingException; import java.net.URLEncoder; public class EncodingTest { public static void main(String[] args) throws UnsupportedEncodingException { String s = "\"A\" B ± \""; System.out.println("URLEncoder.encode returns " + URLEncoder.encode(s, "UTF-8")); System.out.println("getBytes returns " + new String(s.getBytes("UTF-8"), "ISO-8859-1")); } …

5
sqlite3.ProgrammingError:不得使用8位字节串,除非您使用可以解释8位字节串的text_factory
我正在Python中使用SQLite3,试图存储UTF-8 HTML代码段的压缩版本。 代码如下: ... c = connection.cursor() c.execute('create table blah (cid integer primary key,html blob)') ... c.execute('insert or ignore into blah values (?, ?)',(cid, zlib.compress(html))) 此时出现错误: sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly …
90 python  unicode  sqlite  zlib 

5
在HTML中显示Unicode符号
我只想在HTML页面中显示刻度符号(✔)和叉号(✘),但它显示为方框或粘稠度–显然与编码有关。 我已将meta标签设置为显示utf-8,但显然我遗漏了一些东西。 <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 编辑/解决方案:通过使用FireBug所做的评论,我发现页面传递的标题实际上是“ Content-Type:text / html”,而不是UTF-8。使用Notepad ++查看文件格式时,显示我的文件格式为“没有BOM的UTF-8”。现在将其更改为UTF-8,符号现在可以正确显示...但是萤火虫似乎仍指示相同的内容类型。
89 html  unicode 

6
JSON字符编码-浏览器是否很好地支持UTF-8,还是应该使用数字转义序列?
我正在编写一个使用json表示其资源的web服务,并且我在思考对json进行编码的最佳方法有些困惑。阅读json rfc(http://www.ietf.org/rfc/rfc4627.txt)显然,首选编码是utf-8。但是RFC还描述了用于指定字符的字符串转义机制。我认为这通常用于转义非ASCII字符,从而使生成的utf-8有效ASCII。 假设我有一个json字符串,其中包含非ASCII字符(代码点)。我的网络服务应该只是对utf-8进行编码并返回它,还是应该转义所有这些非ascii字符并返回纯ascii? 我希望浏览器能够使用jsonp或eval执行结果。这会影响决策吗?我缺乏对utf-8的各种浏览器javascript支持的知识。 编辑:我想澄清一下,我对如何编码结果的主要担心实际上是关于浏览器对结果的处理。我所读的内容表明,特别是使用JSONP时,浏览器可能对编码敏感。我还没有找到关于该主题的任何非常好的信息,所以我必须开始做一些测试才能看到会发生什么。理想情况下,我只想转义所需的几个字符,而只是utf-8对结果进行编码。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.