程序设计 utf-8

9

我有以下代码，但是，我希望它以UTF-8文件的形式处理外来字符。有没有办法做到这一点，是否需要一些参数？非常感谢您的帮助。谢谢。 try { BufferedReader reader = new BufferedReader(new FileReader("C:/Users/Jess/My Documents/actresses.list")); writer = new BufferedWriter(new FileWriter("C:/Users/Jess/My Documents/actressesFormatted.csv")); while( (line = reader.readLine()) != null) { //If the line starts with a tab then we just want to add a movie //using the current actor's name. if(line.length() == 0) continue; else if(line.charAt(0) …

82 java file-io unicode utf-8 file-format

1

不支持Python解码Unicode

我在Python中的编码有问题。我尝试了不同的方法，但似乎找不到找到将输出编码为UTF-8的最佳方法。这就是我想要做的： result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGoogle传回的第一个Google结果param。这是我得到的错误： exceptions.TypeError: decoding Unicode is not supported 有谁知道我该如何使Python用UTF-8编码输出以避免这种错误？

81 python encoding utf-8 character-encoding

6

在Python中将没有BOM的UTF-8转换为带有BOM的UTF-8

这里有两个问题。我有一组文件，这些文件通常是带有BOM的UTF-8。我想将它们（理想情况下）转换为没有BOM的UTF-8。似乎codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors)可以解决这个问题。但是我真的看不到任何有关用法的好例子。这将是处理此问题的最佳方法吗？ source files: Tue Jan 17$ file brh-m-157.json brh-m-157.json: UTF-8 Unicode (with BOM) text 同样，如果我们能够处理清楚知道的不同输入编码（看到的ASCII和UTF-16），那将是理想的。看来这一切都是可行的。是否有一种解决方案可以采用任何已知的Python编码并以UTF-8格式输出而无需BOM？从下面编辑1个建议的sol'n（谢谢！） fp = open('brh-m-157.json','rw') s = fp.read() u = s.decode('utf-8-sig') s = u.encode('utf-8') print fp.encoding fp.write(s) 这给了我以下错误： IOError: [Errno 9] Bad file descriptor 新闻快讯有人在评论中告诉我，错误是我以'rw'模式而不是'r +'/'r + b'模式打开文件，因此我最终应重新编辑问题并删除已解决的部分。

81 python utf-8 utf-16 byte-order-mark

7

如何在UTF8中编译LaTeX？[关闭]

关闭。此问题不符合堆栈溢出准则。它当前不接受答案。想改善这个问题吗？更新问题，使其成为Stack Overflow的主题。 7年前关闭。改善这个问题我按照ISO标准制作了文档。它不支持ä和ö这样的变音字母。我需要他们。该文档在不使用UTF8的情况下进行编译，但不使用UTF8进行编译。更准确地说，该文件不会在main.tex开头的行中进行编译： \usepackage[utf8]{inputenc} 如何在UTF8中编译我的LaTeX文档？

80 latex utf-8

18

FPDF utf-8编码（HOW-TO）

有人知道如何将FPDF软件包中的编码设置为utf-8吗？或至少是支持希腊字符的ISO-8859-7（希腊文）？基本上我想创建一个包含希腊字符的pdf文件。任何建议都会有所帮助。乔治

80 unicode utf-8 character-encoding fpdf

3

UTF-8编码字符的最大字节数是多少？

一个UTF-8编码字符的最大字节数是多少？我将对以UTF-8编码的String的字节进行加密，因此需要能够计算出UTF-8编码的String的最大字节数。有人可以确认单个UTF-8编码字符的最大字节数吗？

79 utf-8 character-encoding byte character

3

简体中文和繁体中文的语言代码？

我们正在网站上创建多语言子站点。我想使用2个字母的语言代码。西班牙语和法语很容易。他们将获得如下网址： mydomain.com/es mydomain.com/fr 但是我遇到了繁体中文和简体中文的问题。有针对这些语言使用的2个字母代码的标准吗？ mydomain.com/zh mydomain.com/?

79 utf-8 internationalization cjk chinese-locale

3

Python从文件读取并保存到utf-8

我在从文件读取，处理其字符串并将其保存到UTF-8文件时遇到问题。这是代码： try: filehandle = open(filename,"r") except: print("Could not open file " + filename) quit() text = filehandle.read() filehandle.close() 然后，我对可变文本进行一些处理。然后 try: writer = open(output,"w") except: print("Could not open file " + output) quit() #data = text.decode("iso 8859-15") #writer.write(data.encode("UTF-8")) writer.write(text) writer.close() 这样可以完美地输出文件，但是根据我的编辑器，它在iso 8859-15中可以输出。由于相同的编辑器将输入文件（在变量文件名中）识别为UTF-8，所以我不知道为什么会这样。据我的研究表明，注释行应该可以解决问题。但是，当我使用这些行时，产生的文件主要具有特殊字符的乱码，带有波浪号的单词作为文本是西班牙语。当我感到困惑时，我将不胜感激。

79 python python-2.7 utf-8

3

4KB中可以存储多少个字符？

当字符采用utf-8编码时，我可以在4kb中存储多少个字符？

78 cookies utf-8 character

4

将std :: string转换为QString

我std::string content知道包含UTF-8数据。我想将其转换为QString。如何避免在Qt中从ASCII转换？

77 c++ string qt utf-8 qstring

5

UTF-8字符有问题；我看到的不是我存储的

我试图使用UTF-8遇到麻烦。我尝试了很多事情；这是我得到的结果： ????而不是亚洲字符。即使是欧洲文字，我也能Se?or接受Señor。奇怪的乱码（变为乱码？），如SeÃ±or或æ–°æµªæ–°é—»为新浪新闻。黑钻石，例如Seor。最终，我陷入了数据丢失或至少被截断的情况：Sefor Señor。即使我看到正确的文本，它也无法正确排序。我究竟做错了什么？我该如何修复代码？我可以恢复数据吗？

76 mysql unicode utf-8 character-encoding mariadb

10

UTL8与STL中的宽字符转换

是否可以以平台无关的方式将std :: string中的UTF8字符串转换为std :: wstring，反之亦然？在Windows应用程序中，我将使用MultiByteToWideChar和WideCharToMultiByte。但是，代码是为多个操作系统编译的，我仅限于标准C ++库。

76 c++ unicode stl utf-8 character-encoding

4

Ruby方法从UTF-8国际字符中删除重音符号

我正在尝试创建字符串的“规范化”副本，以帮助减少数据库中的重复名称。名称包含许多国际字符（即带重音的字母），我想创建一个删除了重音的副本。我确实遇到了下面的方法，但是无法使其正常工作。我似乎找不到Unicode Hacks插件。 # Utility method that retursn an ASCIIfied, downcased, and sanitized string. # It relies on the Unicode Hacks plugin by means of String#chars. We assume # $KCODE is 'u' in environment.rb. By now we support a wide range of latin # accented letters, based on the Unicode …

74 ruby-on-rails utf-8 internationalization

11

Java-将字符串转换为有效的URI对象

我试图从一个java.net.URI对象String。该字符串包含一些字符，需要用其百分比转义序列替换。但是，当我使用URLEncoder以UTF-8编码对String进行编码时，即使将/替换为其转义序列。如何从String对象获取有效的编码URL？ http://www.google.com?q=a b给出http％3A％2F％2www.google.com ...，而我希望输出为http://www.google.com?q=a% 20b 有人可以告诉我如何实现这一目标。我正在尝试在Android应用程序中执行此操作。因此，我可以访问数量有限的库。

73 java android encoding utf-8

8

如何在Java中的ISO-8859-1和UTF-8之间转换？

有谁知道如何将字符串从ISO-8859-1转换为UTF-8并重新转换为Java？我从网上获取一个字符串并将其保存在RMS（J2ME）中，但是我想保留特殊字符并从RMS中获取字符串，但要使用ISO-8859-1编码。我该怎么做呢？

73 java java-me utf-8 character-encoding iso-8859-1

Questions tagged «utf-8»