Questions tagged «utf-8»

UTF-8是一种字符编码,它使用一个到四个字节的字节序列来描述每个Unicode代码点。它与ASCII向后兼容,同时仍支持所有Unicode代码点的表示。


13
Java与产生相同输出的JavaScript的encodeURIComponent等效吗?
我一直在尝试各种Java代码,试图提出一些将对包含引号,空格和“奇异” Unicode字符的字符串进行编码的东西,并产生与JavaScript的encodeURIComponent函数相同的输出。 我的酷刑测试字符串是:“ A” B±“ 如果我在Firebug中输入以下JavaScript语句: encodeURIComponent('"A" B ± "'); —然后我得到: "%22A%22%20B%20%C2%B1%20%22" 这是我的小测试Java程序: import java.io.UnsupportedEncodingException; import java.net.URLEncoder; public class EncodingTest { public static void main(String[] args) throws UnsupportedEncodingException { String s = "\"A\" B ± \""; System.out.println("URLEncoder.encode returns " + URLEncoder.encode(s, "UTF-8")); System.out.println("getBytes returns " + new String(s.getBytes("UTF-8"), "ISO-8859-1")); } …

6
JSON字符编码-浏览器是否很好地支持UTF-8,还是应该使用数字转义序列?
我正在编写一个使用json表示其资源的web服务,并且我在思考对json进行编码的最佳方法有些困惑。阅读json rfc(http://www.ietf.org/rfc/rfc4627.txt)显然,首选编码是utf-8。但是RFC还描述了用于指定字符的字符串转义机制。我认为这通常用于转义非ASCII字符,从而使生成的utf-8有效ASCII。 假设我有一个json字符串,其中包含非ASCII字符(代码点)。我的网络服务应该只是对utf-8进行编码并返回它,还是应该转义所有这些非ascii字符并返回纯ascii? 我希望浏览器能够使用jsonp或eval执行结果。这会影响决策吗?我缺乏对utf-8的各种浏览器javascript支持的知识。 编辑:我想澄清一下,我对如何编码结果的主要担心实际上是关于浏览器对结果的处理。我所读的内容表明,特别是使用JSONP时,浏览器可能对编码敏感。我还没有找到关于该主题的任何非常好的信息,所以我必须开始做一些测试才能看到会发生什么。理想情况下,我只想转义所需的几个字符,而只是utf-8对结果进行编码。

5
真的好,不好的UTF-8示例测试数据[关闭]
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow的主题。 3年前关闭。 改善这个问题 因此,我们有XSS备忘单来测试XSS过滤-但是除了示例性的良性页面之外,我找不到任何邪恶或格式错误的测试数据来确保我的UTF-8代码可以处理行为异常的数据。 我在哪里可以找到一些很好的数据来进行测试?或什么是棘手的字符序列?
88 unicode  utf-8 



6
使用“ use utf8;” 给我“打印中的宽字符”
如果我运行以下Perl程序: perl -e 'use utf8; print "鸡\n";' 我收到此警告: Wide character in print at -e line 1. 如果我运行此Perl程序: perl -e 'print "鸡\n";' 我没有得到警告。 我认为use utf8必须在Perl脚本中使用UTF-8字符。为什么这不起作用,我该如何解决?我正在使用Perl 5.16.2。如果这是在文件中而不是在命令行中使用一个衬板,我也会遇到同样的问题。
86 perl  unicode  utf-8 

1
WebClient.DownloadString由于编码问题而导致字符变形,但浏览器正常
如下代码: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); 产生一个变量text,其中包含字符串 “ $β$ -Minkowski空间,标量场和洛伦兹不变性问题” 但是,当我在Firefox中访问该URL时, $κ$ -Minkowski空间,标量场和洛伦兹不变性问题 这实际上是正确的。我也试过 var data = (new WebClient()).DownloadData("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20"); var text = System.Text.UTF8Encoding.Default.GetString(data); 但这带来了同样的问题。 我不确定问题出在哪里。提要是否在于对UTF8进行编码,并且浏览器足够聪明以至于可以识别出来,但事实并非如此WebClient?提要是否经过正确的UTF8编码,但是WebClient以其他方式失败了?我该怎么做才能减轻这种情况?


3
如何从文本文件中删除非UTF-8字符
我有一堆用utf-8编码的阿拉伯文,英文,俄文文件。尝试使用Perl脚本处理这些文件时,出现以下错误: Malformed UTF-8 character (fatal) 手动检查这些文件的内容,发现它们中有一些奇怪的字符。现在,我正在寻找一种自动从文件中删除这些字符的方法。 反正有做吗?

7
如何在CSV文件中写入UTF-8
我正在尝试从PyQt4创建csv格式的文本文件QTableWidget。我想用UTF-8编码写文本,因为它包含特殊字符。我使用以下代码: import codecs ... myfile = codecs.open(filename, 'w','utf-8') ... f = result.table.item(i,c).text() myfile.write(f+";") 它一直工作到单元格包含特殊字符为止。我也尝试过 myfile = open(filename, 'w') ... f = unicode(result.table.item(i,c).text(), "utf-8") 但是,当出现特殊字符时,它也会停止。我不知道我在做什么错。
83 python  csv  encoding  utf-8 

5
如何在SQL Server数据库中使用UTF-8排序规则?
我已经将数据库从mysql迁移到使用UTF8的原始mysql数据库SQL Server(政治)。 现在我读到/dba/7346/sql-server-2005-2008-utf-8-collat​​ion-charset SQL Server 2008不支持utf8,这是在开玩笑吗? SQL Server承载多个数据库,大多数数据库都是拉丁编码的。由于迁移的数据库是用于Web发布的,因此我想保持utf8编码。我错过了什么吗?还是需要在应用程序级别进行编码/拒绝?
83 sql-server  utf-8 

6
Unicode可以映射多少个字符?
我要求解释所有Unicode中所有可能有效组合的数量。我知道一个char可以编码为1,2,3或4个字节。即使该char的起始字节清除了应该多长时间,我也不明白为什么连续字节有限制。
82 unicode  utf-8  utf 


3
如何发送UTF-8电子邮件?
当我发送电子邮件时,该电子邮件不显示除英语以外的其他字符。它的确显示如下: 余生ä»ä» 可能知道实际上是什么原因造成的?即使我尝试在脚本中添加Content-type和charset,它仍然显示相同的内容。 我用了 Mail::Factory("mail");
82 php  email  utf-8 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.