Questions tagged «encoding»

编码是一组预定义的规则,用于将某种表示形式的信息可逆地转换为完全不同的表示形式。另一种方法称为解码。这个标签相当通用,但是主要用于二进制编码方案,例如base 64和16进制。

3
Base64编码的真正目的是什么?
为什么我们有Base64编码?我是一个初学者,我真的不明白为什么您会将字节混淆成其他东西(除非是加密的)。在其中一本书中,我读到在无法进行二进制传输时,Base64编码非常有用。例如。当我们发布表单时,它会被编码。但是为什么我们将字节转换为字母呢?我们不能只是将字节转换为字符串格式而在两者之间留有空格吗?例如,00000001 00000004?还是0000000100000004因为字节总是成对出现8而没有任何空间?
81 encoding  base64 

1
不支持Python解码Unicode
我在Python中的编码有问题。我尝试了不同的方法,但似乎找不到找到将输出编码为UTF-8的最佳方法。 这就是我想要做的: result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGoogle传回的第一个Google结果param。 这是我得到的错误: exceptions.TypeError: decoding Unicode is not supported 有谁知道我该如何使Python用UTF-8编码输出以避免这种错误?


5
通过CSS Unicode:之前
我在网页上使用了Font Awesome,并且我想在:before伪元素。 根据文档/备忘单,我必须键入才能获得此字体,但是它不起作用。我认为这是正常的,因为中不支持HTML实体:before。 所以我在Google上搜索了一下,发现如果要在中显示HTML实体:before,则必须使用转义的十六进制引用。 所以我正在寻找十六进制参考但一无所获。我认为这是因为这些都是“私有使用”的值,无论这意味着什么。 有什么办法可以使其正常工作:before吗?
81 html  css  unicode  encoding  icons 

9
将Unicode字符串转换为转义的ASCII字符串
如何转换此字符串: This string contains the Unicode character Pi(π) 转换为转义的ASCII字符串: This string contains the Unicode character Pi(\u03a0) 和反之亦然? C#中当前可用的编码将π字符转换为“?”。我需要保留那个角色。
77 c#  unicode  encoding 

14
在构造使用该数据的XmlReader或XPathDocument之前,如何从基于XML的数据源中删除无效的十六进制字符?
在XmlReader中使用它之前,是否有任何简单/通用的方法来清理基于XML的数据源,以便我可以正常使用与XML上的十六进制字符限制不一致的XML数据? 注意: 该解决方案需要处理使用UTF-8以外的字符编码的XML数据源,例如,通过在XML文档声明中指定字符编码。剥离无效的十六进制字符时不破坏源代码的字符编码已成为主要问题。 删除无效的十六进制字符仅应删除十六进制编码的值,因为您经常会在数据中恰好包含一个与十六进制字符匹配的字符串的数据中找到href值。 背景: 我需要使用符合特定格式(例如Atom或RSS feed)的基于XML的数据源,但希望能够使用已发布的数据源(根据XML规范包含无效的十六进制字符)。 在.NET中,如果您有一个表示XML数据源的Stream,然后尝试使用XmlReader和/或XPathDocument对其进行解析,则会由于XML数据中包含无效的十六进制字符而引发异常。我当前解决此问题的尝试是将Stream解析为字符串,并使用正则表达式删除和/或替换无效的十六进制字符,但是我正在寻找一种性能更高的解决方案。
76 c#  xml  validation  encoding 

8
如何检测文本文件的字符编码?
我尝试检测文件中使用了哪种字符编码。 我尝试使用此代码来获取标准编码 public static Encoding GetFileEncoding(string srcFile) { // *** Use Default of Encoding.Default (Ansi CodePage) Encoding enc = Encoding.Default; // *** Detect byte order mark if any - otherwise assume default byte[] buffer = new byte[5]; FileStream file = new FileStream(srcFile, FileMode.Open); file.Read(buffer, 0, 5); file.Close(); if (buffer[0] == …


3
有什么方法可以突出显示崇高文本或任何其他文本编辑器中的所有特殊重音字符?
我使用HTML将Sublime文本中的特殊字符编码为将所有特殊字符转换为其HTML代码。我在文件的不同部分有很多带重音符号的字符。因此,如果我可以选择所有特殊字符,然后使用插件一次将其全部转换,那就太好了! 是否有仅用于选择所有特殊字符的正则表达式?

6
是斜杠(“ /”)等同于HTTP URL路径部分中的编码斜杠(“%2F”)
我有一个站点在URL的路径部分(而不是查询字符串)中以不同的方式对待“ /”和“%2F”。根据RFC还是现实世界,这是一件坏事吗? 我问是因为我对正在使用的Web框架(Ruby on Rails)以及它下面的层(Passenger,Apache,例如,我必须为Apache启用“ ALLOW_ENCODED_SLASHES”)感到惊讶。我现在倾向于完全摆脱编码的斜杠,但是我想知道是否应该在我看到涉及编码的斜杠的怪异行为时提交错误报告。 至于为什么我首先使用编码的斜杠,基本上我有这样的路由: :controller/:foo/:bar :foo是类似路径的内容,可以包含斜杠。我认为最直接的方法就是仅对URL进行转义,foo从而使斜线被路由机制忽略。现在,我对此表示怀疑,很明显,这些框架并不真正支持此功能,但是根据RFC的说法,这样做是错误的吗? 这是我收集的一些信息: RFC 1738(URL): 通常,当八位字节由字符表示并进行编码时,URL具有相同的解释。但是,对于保留字符而言并非如此:对为特定方案保留的字符进行编码可能会更改URL的语义。 RFC 2396(URI): 这些字符被称为“保留”,因为它们在URI组件中的使用仅限于其保留目的。如果URI组件的数据将与保留用途冲突,则必须在形成URI之前转义冲突的数据。 (这里的转义除了编码保留字符之外还意味着其他吗?) RFC 2616(HTTP / 1.1): 除“保留”和“不安全”集中的字符以外的其他字符(请参阅RFC 2396 [42])等效于其““%” HEX HEX“编码。 还有一个针对Rails的错误报告,他们似乎希望编码的斜杠的行为有所不同: 是的,我期望会有不同的结果,因为它们指向的是不同的资源。 它在根目录中查找文字文件“ foo / bar”。非转义版本正在目录foo中查找文件栏。 从RFC可以明显看出,原始字符与编码字符等效于未保留字符,但是保留字符的含义是什么?
74 http  url  encoding 

3
是否存在将.NET字符串编码为JavaScript字符串以用于MS Ajax的标准方法?
我正在尝试使用RegisterStartUpScript.NET 3.5中MS ScriptManager的方法将SQL Server异常的输出传递给客户端。对于某些错误,这可以正常工作,但是当异常包含单引号时,警报将失败。 我不想只转义单引号。我是否可以调用一个标准函数来转义用于JavaScript的任何特殊字符? string scriptstring = "alert('" + ex.Message + "');"; ScriptManager.RegisterStartupScript(this, this.GetType(), "Alert", scriptstring , true); 编辑: 感谢@tpeczek,代码 几乎对我:),但稍作修改(转义单引号),就可以了。 我在这里包括了我的修订版本... public class JSEncode { /// <summary> /// Encodes a string to be represented as a string literal. The format /// is essentially a JSON string. /// /// …

11
Java-将字符串转换为有效的URI对象
我试图从一个java.net.URI对象String。该字符串包含一些字符,需要用其百分比转义序列替换。但是,当我使用URLEncoder以UTF-8编码对String进行编码时,即使将/替换为其转义序列。 如何从String对象获取有效的编码URL? http://www.google.com?q=a b给出http%3A%2F%2www.google.com ...,而我希望输出为http://www.google.com?q=a% 20b 有人可以告诉我如何实现这一目标。 我正在尝试在Android应用程序中执行此操作。因此,我可以访问数量有限的库。
73 java  android  encoding  utf-8 

6
如何在PHP中替换Microsoft编码的引号
“ ” ‘ ’由于我的应用程序中存在编码问题,我需要用常规引号('和“)替换Microsoft Word的单引号和双引号()版本。我不需要它们成为HTML实体,也无法更改数据库架构。 我有两个选择:使用正则表达式或关联的数组。 有一个更好的方法吗?

9
读取UTF-8-BOM标记
我正在通过FileReader读取文件-该文件已经过UTF-8解码(使用BOM),现在的问题是:我读取了文件并输出了字符串,但可悲的是BOM表标记也被输出了。为什么会这样? fr = new FileReader(file); br = new BufferedReader(fr); String tmp = null; while ((tmp = br.readLine()) != null) { String text; text = new String(tmp.getBytes(), "UTF-8"); content += text + System.getProperty("line.separator"); } 第一行后输出 ?<style>
71 java  file  encoding 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.