Questions tagged «utf-8»

UTF-8是一种字符编码,它使用一个到四个字节的字节序列来描述每个Unicode代码点。它与ASCII向后兼容,同时仍支持所有Unicode代码点的表示。

7
URL中的Unicode字符
在2010年,您是否会在大型Web门户中提供包含UTF-8字符的URL? 根据URL上的RFC禁止使用Unicode字符(请参阅此处)。必须对它们进行百分比编码以符合标准。 不过,我的主要目的是提供未编码的字符,其唯一目的是拥有美观的URL,因此百分比编码是可行的。 无论RFC怎么说,所有主流浏览器似乎都可以解析这些URL。不过,我的总体印象是,离开网络浏览器领域时,它变得非常不稳定: URL复制并粘贴到文本文件,电子邮件甚至具有不同编码的网站中 HTTP客户端库 异国情调的浏览器,RSS阅读器 我的印象是正确的,在这里一定会遇到麻烦,因此,如果您正在为非技术受众提供服务,这还不是一个实际的解决方案,并且即使引用和传递所有链接也都能够正常工作,这一点很重要吗? 是否有一些神奇的方法可以在HTML中提供美观的URL http://www.example.com/düsseldorf?neighbourhood=Lörick 可以原样复制并粘贴特殊字符,但是在较旧的客户端中重复使用时可以正常工作吗?
135 html  url  unicode  utf-8 

11
在页面上显示“’”,而不是“'”
’显示在我的页面上,而不是'。 我在标签和HTTP标头中都Content-Type设置了:UTF-8<head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 另外,我的浏览器设置为Unicode (UTF-8): 那么问题是什么,我该如何解决?
133 encoding  utf-8  mojibake 



5
为什么要在python中通过字符串声明unicode?
我仍在学习python,我对此表示怀疑: 在python 2.6.x中,我通常像这样在文件头中声明编码(如在PEP 0263中) # -*- coding: utf-8 -*- 之后,我的字符串照常编写: a = "A normal string without declared Unicode" 但是每次我看到python项目代码时,都不会在标头中声明编码。而是在每个这样的字符串处声明它: a = u"A string with declared Unicode" 有什么不同?目的是什么?我知道Python 2.6.x默认设置了ASCII编码,但是它可以被标头声明覆盖,那么每个字符串声明的意义是什么? 附录:似乎我将文件编码和字符串编码混为一谈了。感谢您的解释:)
122 python  encoding  utf-8 

11
Outlook自动清理我的换行符并弄乱了我的电子邮件格式
我正在使用dotnet框架发送电子邮件。这是我用来创建消息的模板: Date of Hire: %HireDate% Annual Salary: %AnnualIncome% Reason for Request: %ReasonForRequest% Name of Voluntary Employee: %FirstName% %LastName% Total Coverage Applied For: %EECoverageAmount% Guaranteed Coverage Portion: %GICoveragePortion% Amount Subject to Medical Evident: %GIOverage% 在Outlook中收到消息后,Outlook会告诉我“该消息中的多余换行符已被删除”。消息显示如下: Date of Hire: 9/28/2001 Annual Salary: $100,000 Reason for Request: New Hire Name of Voluntary Employee: …
119 .net  utf-8  outlook  smtp 



4
在.NET中将对象序列化为UTF-8 XML
为了简洁起见,删除了正确的对象处理方法,但是如果这是将对象编码为内存中的UTF-8的最简单方法,我会感到震惊。必须有一种更简单的方法吗? var serializer = new XmlSerializer(typeof(SomeSerializableObject)); var memoryStream = new MemoryStream(); var streamWriter = new StreamWriter(memoryStream, System.Text.Encoding.UTF8); serializer.Serialize(streamWriter, entry); memoryStream.Seek(0, SeekOrigin.Begin); var streamReader = new StreamReader(memoryStream, System.Text.Encoding.UTF8); var utf8EncodedXml = streamReader.ReadToEnd();

12
Java中的“编码不可映射字符”警告
我目前正在研究一个Java项目,该项目在编译时会发出以下警告: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; 我不确定SO将如何在日期之前呈现该字符,但是它应该是版权符号,并在警告中以菱形问号显示。 值得注意的是,该字符正确地出现在输出工件中,但是警告令人讨厌,并且文本编辑器可能有一天会触摸包含此类的文件,该文本编辑器会错误地保存编码... 如何将这个字符注入“版权”字符串中,以便编译器满意,并且将符号保留在文件中而没有潜在的重新编码问题?
112 java  encoding  utf-8  ascii 

8
在MySQL中设置名称utf8?
我经常在使用MySQL的PHP​​脚本中看到类似的内容 query("SET NAMES utf8"); 我从来没有为任何项目都这样做,所以我对此有两个基本问题。 这仅是通过PDO完成吗? 如果不是PDO特定的事情,那么这样做的目的是什么?我意识到它正在为mysql设置编码,但是我的意思是,我从未使用过它,所以为什么要使用它?
110 php  mysql  utf-8 

6
如何从Perl输出UTF-8?
我正在尝试使用“ utf8”编译指示来编写Perl脚本,并且得到了意外的结果。我正在使用Mac OS X 10.5(Leopard),并且正在使用TextMate进行编辑。我的编辑器和操作系统的所有设置都默认为以utf-8格式写入文件。 但是,当我在文本文件中输入以下内容,将其另存为“ .pl”并执行时,我得到了友好的“带问号的钻石”来代替非ASCII字符。 #!/usr/bin/env perl -w use strict; use utf8; my $str = 'Çirçös'; print( "$str\n" ); 知道我在做什么错吗?我期望在输出中得到'Çirçös',但是我得到的是'.ir s'。
110 perl  unicode  utf-8 

3
UTF-8“可变宽度编码”如何工作?
unicode标准中有足够的代码点,您需要4个字节来存储它们。这就是UTF-32编码的作用。然而,UTF-8编码通过使用一种称为“可变宽度编码”的方式将它们压缩到更小的空间中。 实际上,它设法在一个字节中代表了US-ASCII的前127个字符,这看起来与真实的ASCII完全一样,因此您可以将许多ascii文本解释为UTF-8,而无需对其进行任何处理。整洁的把戏。那么它是怎样工作的? 我将在这里问和回答我自己的问题,因为我只是做了一些阅读来弄清楚这个问题,我认为这可能会节省一些时间。另外,如果我有一些错误,也许有人可以纠正我。

11
ruby 1.9:UTF-8中的无效字节序列
我正在用Ruby(1.9)编写一个爬虫,该爬虫使用了来自许多随机站点的大量HTML。 尝试提取链接时,我决定只使用.scan(/href="(.*?)"/i)nokogiri / hpricot(主要是提高速度)。问题是我现在收到很多“ invalid byte sequence in UTF-8”错误。 据我了解,该net/http库没有任何特定于编码的选项,并且进来的东西基本上没有正确标记。 实际使用该传入数据的最佳方法是什么?我尝试.encode设置了replace和invalid选项,但到目前为止没有成功...
109 ruby  encoding  utf-8 

8
字节顺序标记破坏了Java中的文件读取
我正在尝试使用Java读取CSV文件。有些文件的开头可能有字节顺序标记,但不是全部。如果存在,字节顺序将与第一行的其余部分一起读取,从而导致字符串比较出现问题。 是否存在一种跳过字节顺序标记的简单方法? 谢谢!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.