Questions tagged «encoding»

编码是一组预定义的规则,用于将某种表示形式的信息可逆地转换为完全不同的表示形式。另一种方法称为解码。这个标签相当通用,但是主要用于二进制编码方案,例如base 64和16进制。

6
正则表达式中的“ \ d”表示数字吗?
我发现123,\d比赛1和3,但不会2。我想知道\d匹配的数字是否满足哪种要求?我说的是Python样式的正则表达式。 Gedit中的正则表达式插件使用Python样式正则表达式。我创建了一个文本文件,其内容为 123 正则表达式只1与3匹配\d;2不是。 通常,对于一系列数字,中间没有其他字符,只有奇数位是匹配的,偶数位不是。对于例如12345,比赛是1,3和5。
147 python  regex  encoding  gedit 

6
如何在C#中将字符串转换为UTF-8?
我有一个从第三方应用程序收到的字符串,我想在Windows Surface上使用C#以任何语言正确显示它。 由于编码不正确,我的一部分字符串在西班牙语中看起来像这样: Acción 而它应该看起来像这样: Acción 根据关于这个问题的答案: 如何知道C#中的字符串编码,我正在接收的编码应该已经在UTF-8上了,但是它是在Encoding.Default(可能是ANSI?)上读取的。 我正在尝试将此字符串转换为真正的UTF-8,但是问题之一是我只能看到Encoding类的一个子集(仅适用于UTF8和Unicode属性),可能是因为我仅限于Windows Surface API。 我尝试了一些在互联网上找到的代码片段,但到目前为止,对于东方语言(例如韩语),它们都没有被证明是成功的。一个示例如下: var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); myString= utf8.GetString(utfBytes, 0, utfBytes.Length); 我还尝试将字符串提取到字节数组中,然后使用UTF8.GetString: byte[] myByteArray = new byte[myString.Length]; for (int ix = 0; ix < myString.Length; ++ix) { char ch = myString[ix]; myByteArray[ix] = (byte) ch; } myString …

11
更改Python的默认编码?
从控制台运行应用程序时,Python存在许多“无法编码”和“无法解码”的问题。但是在 Eclipse PyDev IDE中,默认字符编码设置为UTF-8,我很好。 我到处搜索以设置默认编码,人们说Python删除了 sys.setdefaultencoding在启动时函数,因此我们无法使用它。 那么什么是最好的解决方案?

15
Java:如何确定流的正确字符集编码
参考以下线程: Java App:无法正确读取iso-8859-1编码的文件 以编程方式确定输入流/文件的正确字符集编码的最佳方法是什么? 我尝试使用以下方法: File in = new File(args[0]); InputStreamReader r = new InputStreamReader(new FileInputStream(in)); System.out.println(r.getEncoding()); 但是在我知道要用ISO8859_1编码的文件上,上面的代码会产生ASCII,这是不正确的,并且不允许我将文件的内容正确地呈现回控制台。


6
为什么默认编码为ASCII时Python为什么打印unicode字符?
从Python 2.6 shell: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> 我希望在打印语句后出现一些乱码或错误,因为“é”字符不是ASCII的一部分,并且我未指定编码。我想我不明白ASCII是默认编码的意思。 编辑 我将编辑移至“ 答案”部分,并按建议接受。

4
这是从哪里来的:-*-编码:utf-8-*-
Python将以下内容识别为定义文件编码的指令: # -*- coding: utf-8 -*- 我确实在(-*- var: value -*-)之前看到过这种说明。它从何而来?完整规范是什么,例如,值可以包含空格,特殊符号,换行符,甚至-*-本身吗? 我的程序将编写纯文本文件,我想使用这种格式在其中包含一些元数据。
135 python  file  text  encoding  emacs 

7
C#是否等效于JavaScript的encodeURIComponent()?
在JavaScript中: encodeURIComponent("©√") == "%C2%A9%E2%88%9A" C#应用程序是否等效?为了转义HTML字符,我使用了: txtOut.Text = Regex.Replace(txtIn.Text, @"[\u0080-\uFFFF]", m => @"&#" + ((int)m.Value[0]).ToString() + ";"); 但是我不确定如何将匹配项转换为JS使用的正确十六进制格式。例如此代码: txtOut.Text = Regex.Replace(txtIn.Text, @"[\u0080-\uFFFF]", m => @"%" + String.Format("{0:x}", ((int)m.Value[0]))); 返回“ %a9%221a"的"©√",而不是"%C2%A9%E2%88%9A"它看起来像我需要了分割字符串为字节或东西。 编辑:这是一个Windows应用程序中,唯一可用的项目System.Web有:AspNetHostingPermission,AspNetHostingPermissionAttribute,和AspNetHostingPermissionLevel。

11
在页面上显示“’”,而不是“'”
’显示在我的页面上,而不是'。 我在标签和HTTP标头中都Content-Type设置了:UTF-8<head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 另外,我的浏览器设置为Unicode (UTF-8): 那么问题是什么,我该如何解决?
133 encoding  utf-8  mojibake 

10
URL是否允许包含空格?
是否允许URI(特别是HTTP URL)包含一个或多个空格字符?如果必须对URL 进行编码,+这是通常遵循的约定还是合法的选择? 特别是,有人可以指向RFC指出必须对带有空格的URL 进行编码吗? 提出问题的动机:在对网站进行Beta测试时,我注意到某些URL的构造带有空格。Firefox似乎做对了,这让我感到惊讶!但是我希望能够将开发人员指向RFC,以便他们觉得有必要修复这些URL。
132 html  http  url  encoding 

6
Java FileReader编码问题
我尝试使用java.io.FileReader读取一些文本文件并将其转换为字符串,但是我发现结果编码错误并且根本不可读。 这是我的环境: Windows 2003,操作系统编码:CP1252 Java 5.0 我的文件是UTF-8编码或CP1252编码的,其中一些(UTF-8编码的文件)可能包含中文(非拉丁文)字符。 我使用以下代码来完成我的工作: private static String readFileAsString(String filePath) throws java.io.IOException{ StringBuffer fileData = new StringBuffer(1000); FileReader reader = new FileReader(filePath); //System.out.println(reader.getEncoding()); BufferedReader reader = new BufferedReader(reader); char[] buf = new char[1024]; int numRead=0; while((numRead=reader.read(buf)) != -1){ String readData = String.valueOf(buf, 0, numRead); fileData.append(readData); buf = …
130 java  file  unicode  encoding 

9
确定C#中字符串的编码
有什么方法可以确定C#中的字符串编码吗? 说,我有一个文件名字符串,但是我不知道它是以Unicode UTF-16还是系统默认编码编码的,我如何找出来?
127 c#  string  encoding 



5
为什么要在python中通过字符串声明unicode?
我仍在学习python,我对此表示怀疑: 在python 2.6.x中,我通常像这样在文件头中声明编码(如在PEP 0263中) # -*- coding: utf-8 -*- 之后,我的字符串照常编写: a = "A normal string without declared Unicode" 但是每次我看到python项目代码时,都不会在标头中声明编码。而是在每个这样的字符串处声明它: a = u"A string with declared Unicode" 有什么不同?目的是什么?我知道Python 2.6.x默认设置了ASCII编码,但是它可以被标头声明覆盖,那么每个字符串声明的意义是什么? 附录:似乎我将文件编码和字符串编码混为一谈了。感谢您的解释:)
122 python  encoding  utf-8 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.