Questions tagged «utf-8»

UTF-8是一种字符编码,它使用一个到四个字节的字节序列来描述每个Unicode代码点。它与ASCII向后兼容,同时仍支持所有Unicode代码点的表示。

9
使用FileWriter(Java)以UTF-8格式编写文件吗?
我有以下代码,但是,我希望它以UTF-8文件的形式处理外来字符。有没有办法做到这一点,是否需要一些参数? 非常感谢您的帮助。谢谢。 try { BufferedReader reader = new BufferedReader(new FileReader("C:/Users/Jess/My Documents/actresses.list")); writer = new BufferedWriter(new FileWriter("C:/Users/Jess/My Documents/actressesFormatted.csv")); while( (line = reader.readLine()) != null) { //If the line starts with a tab then we just want to add a movie //using the current actor's name. if(line.length() == 0) continue; else if(line.charAt(0) …

1
不支持Python解码Unicode
我在Python中的编码有问题。我尝试了不同的方法,但似乎找不到找到将输出编码为UTF-8的最佳方法。 这就是我想要做的: result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGoogle传回的第一个Google结果param。 这是我得到的错误: exceptions.TypeError: decoding Unicode is not supported 有谁知道我该如何使Python用UTF-8编码输出以避免这种错误?

6
在Python中将没有BOM的UTF-8转换为带有BOM的UTF-8
这里有两个问题。我有一组文件,这些文件通常是带有BOM的UTF-8。我想将它们(理想情况下)转换为没有BOM的UTF-8。似乎codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors)可以解决这个问题。但是我真的看不到任何有关用法的好例子。这将是处理此问题的最佳方法吗? source files: Tue Jan 17$ file brh-m-157.json brh-m-157.json: UTF-8 Unicode (with BOM) text 同样,如果我们能够处理清楚知道的不同输入编码(看到的ASCII和UTF-16),那将是理想的。看来这一切都是可行的。是否有一种解决方案可以采用任何已知的Python编码并以UTF-8格式输出而无需BOM? 从下面编辑1个建议的sol'n(谢谢!) fp = open('brh-m-157.json','rw') s = fp.read() u = s.decode('utf-8-sig') s = u.encode('utf-8') print fp.encoding fp.write(s) 这给了我以下错误: IOError: [Errno 9] Bad file descriptor 新闻快讯 有人在评论中告诉我,错误是我以'rw'模式而不是'r +'/'r + b'模式打开文件,因此我最终应重新编辑问题并删除已解决的部分。

7
如何在UTF8中编译LaTeX?[关闭]
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow的主题。 7年前关闭。 改善这个问题 我按照ISO标准制作了文档。它不支持ä和ö这样的变音字母。我需要他们。该文档在不使用UTF8的情况下进行编译,但不使用UTF8进行编译。更准确地说,该文件不会在main.tex开头的行中进行编译: \usepackage[utf8]{inputenc} 如何在UTF8中编译我的LaTeX文档?
80 latex  utf-8 

18
FPDF utf-8编码(HOW-TO)
有人知道如何将FPDF软件包中的编码设置为utf-8吗?或至少是支持希腊字符的ISO-8859-7(希腊文)? 基本上我想创建一个包含希腊字符的pdf文件。 任何建议都会有所帮助。乔治


3
简体中文和繁体中文的语言代码?
我们正在网站上创建多语言子站点。 我想使用2个字母的语言代码。西班牙语和法语很容易。他们将获得如下网址: mydomain.com/es mydomain.com/fr 但是我遇到了繁体中文和简体中文的问题。有针对这些语言使用的2个字母代码的标准吗? mydomain.com/zh mydomain.com/?

3
Python从文件读取并保存到utf-8
我在从文件读取,处理其字符串并将其保存到UTF-8文件时遇到问题。 这是代码: try: filehandle = open(filename,"r") except: print("Could not open file " + filename) quit() text = filehandle.read() filehandle.close() 然后,我对可变文本进行一些处理。 然后 try: writer = open(output,"w") except: print("Could not open file " + output) quit() #data = text.decode("iso 8859-15") #writer.write(data.encode("UTF-8")) writer.write(text) writer.close() 这样可以完美地输出文件,但是根据我的编辑器,它在iso 8859-15中可以输出。由于相同的编辑器将输入文件(在变量文件名中)识别为UTF-8,所以我不知道为什么会这样。据我的研究表明,注释行应该可以解决问题。但是,当我使用这些行时,产生的文件主要具有特殊字符的乱码,带有波浪号的单词作为文本是西班牙语。当我感到困惑时,我将不胜感激。



5
UTF-8字符有问题;我看到的不是我存储的
我试图使用UTF-8遇到麻烦。 我尝试了很多事情;这是我得到的结果: ????而不是亚洲字符。即使是欧洲文字,我也能Se?or接受Señor。 奇怪的乱码(变为乱码?),如Señor或新浪新闻为新浪新闻。 黑钻石,例如Seor。 最终,我陷入了数据丢失或至少被截断的情况:Sefor Señor。 即使我看到正确的文本,它也无法正确排序。 我究竟做错了什么?我该如何修复代码?我可以恢复数据吗?

10
UTL8与STL中的宽字符转换
是否可以以平台无关的方式将std :: string中的UTF8字符串转换为std :: wstring,反之亦然?在Windows应用程序中,我将使用MultiByteToWideChar和WideCharToMultiByte。但是,代码是为多个操作系统编译的,我仅限于标准C ++库。

4
Ruby方法从UTF-8国际字符中删除重音符号
我正在尝试创建字符串的“规范化”副本,以帮助减少数据库中的重复名称。名称包含许多国际字符(即带重音的字母),我想创建一个删除了重音的副本。 我确实遇到了下面的方法,但是无法使其正常工作。我似乎找不到Unicode Hacks插件。 # Utility method that retursn an ASCIIfied, downcased, and sanitized string. # It relies on the Unicode Hacks plugin by means of String#chars. We assume # $KCODE is 'u' in environment.rb. By now we support a wide range of latin # accented letters, based on the Unicode …

11
Java-将字符串转换为有效的URI对象
我试图从一个java.net.URI对象String。该字符串包含一些字符,需要用其百分比转义序列替换。但是,当我使用URLEncoder以UTF-8编码对String进行编码时,即使将/替换为其转义序列。 如何从String对象获取有效的编码URL? http://www.google.com?q=a b给出http%3A%2F%2www.google.com ...,而我希望输出为http://www.google.com?q=a% 20b 有人可以告诉我如何实现这一目标。 我正在尝试在Android应用程序中执行此操作。因此,我可以访问数量有限的库。
73 java  android  encoding  utf-8 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.