Questions tagged «character-encoding»

字符编码是指将字符表示为一系列字节的方式。Web的字符编码在编码标准中定义。

6
如何在C#中将字符串转换为UTF-8?
我有一个从第三方应用程序收到的字符串,我想在Windows Surface上使用C#以任何语言正确显示它。 由于编码不正确,我的一部分字符串在西班牙语中看起来像这样: Acción 而它应该看起来像这样: Acción 根据关于这个问题的答案: 如何知道C#中的字符串编码,我正在接收的编码应该已经在UTF-8上了,但是它是在Encoding.Default(可能是ANSI?)上读取的。 我正在尝试将此字符串转换为真正的UTF-8,但是问题之一是我只能看到Encoding类的一个子集(仅适用于UTF8和Unicode属性),可能是因为我仅限于Windows Surface API。 我尝试了一些在互联网上找到的代码片段,但到目前为止,对于东方语言(例如韩语),它们都没有被证明是成功的。一个示例如下: var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); myString= utf8.GetString(utfBytes, 0, utfBytes.Length); 我还尝试将字符串提取到字节数组中,然后使用UTF8.GetString: byte[] myByteArray = new byte[myString.Length]; for (int ix = 0; ix < myString.Length; ++ix) { char ch = myString[ix]; myByteArray[ix] = (byte) ch; } myString …

22
如何从文件开头删除
我有一个CSS文件,当我使用gedit打开它时看起来不错,但是当PHP读取它(将所有CSS文件合并为一个文件)时,此CSS前面有以下字符: PHP删除了所有空格,因此代码中间的一个随机“ 正如我提到的,当我在gedit中打开文件时,我实际上看不到这些字符,因此我无法轻松地删除它们。 我用谷歌搜索了这个问题,文件编码显然有问题,这是有道理的,因为我一直在通过ftp和rsync用一系列文本编辑器将文件转移到不同的Linux / Windows服务器上。我对字符编码的了解并不多,所以可以帮助您。 如果有帮助,文件将以UTF-8格式保存,而gedit不允许我将其保存为ISO-8859-15格式(文档包含一个或多个无法使用指定字符编码进行编码的字符)。我尝试使用Windows和Linux行尾保存它,但是都没有帮助。

8
我可以让git识别UTF-16文件为文本吗?
我正在git中跟踪Virtual PC虚拟机文件(* .vmc),进行更改后git将该文件标识为二进制文件,因此不会对我造成影响。我发现该文件使用UTF-16编码。 可以教git识别该文件是文本并适当处理吗? 我在Cygwin下使用git,将core.autocrlf设置为false。如有必要,我可以在UNIX下使用mSysGit或git。

15
Java:如何确定流的正确字符集编码
参考以下线程: Java App:无法正确读取iso-8859-1编码的文件 以编程方式确定输入流/文件的正确字符集编码的最佳方法是什么? 我尝试使用以下方法: File in = new File(args[0]); InputStreamReader r = new InputStreamReader(new FileInputStream(in)); System.out.println(r.getEncoding()); 但是在我知道要用ISO8859_1编码的文件上,上面的代码会产生ASCII,这是不正确的,并且不允许我将文件的内容正确地呈现回控制台。

12
如何将Apache的默认编码更改为UTF-8?
我使用的是托管公司,如果文件index.html不在目录中,它将在目录中列出文件,它使用iso-8859-1作为默认编码。 如果服务器是Apache,是否可以将UTF-8设置为默认值? 更新:另外,我发现它实际上使用的是HTML 3.2的DOCTYPE,然后根本没有字符集...因此它没有设置任何编码。但是有没有办法将其更改为使用UTF-8?


16
谁在S​​pring MVC中设置响应内容类型(@ResponseBody)
我在注释驱动的Spring MVC Java Web应用程序中运行在Jetty Web服务器上运行(当前在Maven Jetty插件中)。 我正在尝试使用一种仅返回String帮助文本的控制器方法来提供一些AJAX支持。资源采用UTF-8编码,字符串也采用UTF-8编码,但是我来自服务器的回复是 content-encoding: text/plain;charset=ISO-8859-1 即使我的浏览器发送 Accept-Charset windows-1250,utf-8;q=0.7,*;q=0.7 我正在以某种方式使用spring的默认配置 我发现了将这个bean添加到配置中的提示,但是我认为它没有被使用,因为它说它不支持编码,而是使用默认编码。 <bean class="org.springframework.http.converter.StringHttpMessageConverter"> <property name="supportedMediaTypes" value="text/plain;charset=UTF-8" /> </bean> 我的控制器代码是(请注意,这种响应类型的更改对我不起作用): @RequestMapping(value = "ajax/gethelp") public @ResponseBody String handleGetHelp(Locale loc, String code, HttpServletResponse response) { log.debug("Getting help for code: " + code); response.setContentType("text/plain;charset=UTF-8"); String help = messageSource.getMessage(code, null, loc); log.debug("Help …




3
UTF-8“可变宽度编码”如何工作?
unicode标准中有足够的代码点,您需要4个字节来存储它们。这就是UTF-32编码的作用。然而,UTF-8编码通过使用一种称为“可变宽度编码”的方式将它们压缩到更小的空间中。 实际上,它设法在一个字节中代表了US-ASCII的前127个字符,这看起来与真实的ASCII完全一样,因此您可以将许多ascii文本解释为UTF-8,而无需对其进行任何处理。整洁的把戏。那么它是怎样工作的? 我将在这里问和回答我自己的问题,因为我只是做了一些阅读来弄清楚这个问题,我认为这可能会节省一些时间。另外,如果我有一些错误,也许有人可以纠正我。

5
URL编码Unicode字符的正确方法是什么?
我知道非标准的%uxxxx方案,但这似乎不是明智的选择,因为该方案已被W3C拒绝。 一些有趣的例子: 心性。如果我在浏览器中输入以下内容: http://www.google.com/search?q=♥ 然后复制并粘贴它,我看到这个网址 http://www.google.com/search?q=%E2%99%A5 这似乎使Firefox(或Safari)正在执行此操作。 urllib.quote_plus(x.encode("latin-1")) '%E2%99%A5' 这很有意义,除了不能用Latin-1编码的东西(例如三点字符)。 … 如果我输入网址 http://www.google.com/search?q=… 到我的浏览器,然后复制并粘贴,我得到 http://www.google.com/search?q=%E2%80%A6 背部。这似乎是这样做的结果 urllib.quote_plus(x.encode("utf-8")) 这很有意义,因为…无法使用Latin-1进行编码。 但是对于我来说,这还不清楚,浏览器如何知道是使用UTF-8还是Latin-1进行解码。 由于这似乎是模棱两可的: In [67]: u"…".encode('utf-8').decode('latin-1') Out[67]: u'\xc3\xa2\xc2\x80\xc2\xa6' 可以,所以我不知道浏览器如何确定是使用UTF-8还是Latin-1对其进行解码。 使用我需要处理的特殊字符正确的做法是什么?

11
java.sql.SQLException:不正确的字符串值:'\ xF0 \ x9F \ x91 \ xBD \ xF0 \ x9F…'
我有以下字符串值:“ walmart obama👽💔” 我正在使用MySQL和Java。 我收到以下异常:`java.sql.SQLException:不正确的字符串值:'\ xF0 \ x9F \ x91 \ xBD \ xF0 \ x9F ...' 这是我要插入的变量: var1 varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL` 我尝试插入“沃尔玛奥巴马(Walmart obama)”的Java代码是prepareStatement。所以我正在使用该setString()方法。 看来问题在于值the的编码。我怎样才能解决这个问题?以前我使用的是Derby SQL,而值👽💔最终只是两个平方(我认为这是空字符的表示形式) 非常感谢所有帮助!

2
将PowerShell的默认输出编码更改为UTF-8
默认情况下,当您将命令的输出重定向到文件或将其通过管道传递到PowerShell中的其他内容时,编码为UTF-16,这没有用。我希望将其更改为UTF-8。 可以根据具体情况通过将>foo.txt语法替换为来完成| out-file foo.txt -encoding utf8此操作,但这很麻烦每次都要重复。 在PowerShell中进行设置的持久方法是将它们放入其中\Users\me\Documents\WindowsPowerShell\profile.ps1。我已验证该文件确实在启动时执行。 据说可以设置输出编码,$PSDefaultParameterValues = @{'Out-File:Encoding' = 'utf8'}但是我已经尝试过了,但是没有效果。 https://blogs.msdn.microsoft.com/powershell/2006/12/11/outputencoding-to-the-rescue/讨论$OutputEncoding乍一看似乎应该是相关的,但随后讨论的是编码输出以ASCII表示,这实际上不是实际情况。 如何将PowerShell设置为使用UTF-8?

6
的含义-<?xml version =“ 1.0” encoding =“ utf-8”?>
我是XML的新手,我试图了解基础知识。我在“学习XML”中阅读了下面的行,但是对我来说仍然不清楚。有人可以指向我清楚说明这些基础的书或网站吗? 通过学习XML: XML声明描述了文档的一些最常规属性,告诉XML处理器它需要XML解析器来解释该文档。 这是什么意思? 我了解这一xml version部分-文档和文档用户都应该在相同版本的XML中“交谈”。但是那encoding部分呢?为什么有必要?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.