Questions tagged «utf-8»

UTF-8是一种字符编码,它使用一个到四个字节的字节序列来描述每个Unicode代码点。它与ASCII向后兼容,同时仍支持所有Unicode代码点的表示。

11
将字符串编码为UTF-8
我有一个带有“ñ”字符的字符串,并且我有一些问题。我需要将此字符串编码为UTF-8编码。我已经通过这种方式尝试过,但是没有用: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); 如何将该字符串编码为utf-8?
190 java  utf-8 

9
如何用Java编写UTF-8文件?
我有一些当前代码,问题是它创建了1252代码页文件,我想强制它创建UTF-8文件 任何人都可以通过此代码帮助我,因为我说它当前可以工作...但是我需要强制保存utf ..我可以传递参数或其他东西吗? 这就是我所拥有的,任何帮助都非常感谢 var out = new java.io.FileWriter( new java.io.File( path )), text = new java.lang.String( src || "" ); out.write( text, 0, text.length() ); out.flush(); out.close();
180 java  file-io  utf-8 

11
将Unicode转换为ASCII且在Python中没有错误
我的代码只是抓取一个网页,然后将其转换为Unicode。 html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) 但是我得到了UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal not in range(128) 我认为这意味着HTML在某处包含一些错误的Unicode尝试。我可以删除导致问题的任何代码字节而不出错吗?

15
如何确定OS X中的文件编码?
我正在尝试在TextMate的LaTeX文件中输入一些UTF-8字符(它的默认编码为UTF-8),但是LaTeX似乎不理解它们。 运行可以cat my_file.tex在终端中正确显示字符。运行ls -al显示了我从未见过的东西:文件列表旁边的“ @”: -rw-r--r--@ 1 me users 2021 Feb 11 18:05 my_file.tex (是的,我正在\usepackage[utf8]{inputenc}LaTeX中使用。) 我发现了iconv,但似乎无法告诉我编码是什么-只有在弄清楚后才会转换。
170 macos  encoding  latex  utf-8 


14
错误UnicodeDecodeError:'utf-8'编解码器无法解码位置0的字节0xff:无效的起始字节
https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools 在上述站点上编译“ process.py”时发生错误。 python tools/process.py --input_dir data -- operation resize --outp ut_dir data2/resize data/0.jpg -> data2/resize/0.png 追溯(最近一次通话): File "tools/process.py", line 235, in <module> main() File "tools/process.py", line 167, in main src = load(src_path) File "tools/process.py", line 113, in load contents = open(path).read() File"/home/user/anaconda3/envs/tensorflow_2/lib/python3.5/codecs.py", line 321, in decode (result, consumed) = …
162 python  python-3.x  utf-8 


9
在Django中保存Unicode字符串时,MySQL“字符串值不正确”错误
尝试将first_name,last_name保存到Django的auth_user模型时,出现奇怪的错误消息。 失败的例子 user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: '\xC4\x8Dius' for column 'last_name' at row 104 user.first_name = u'Валерий' user.last_name = u'Богданов' user.save() >>> Incorrect string value: '\xD0\x92\xD0\xB0\xD0\xBB...' for column 'first_name' at row 104 user.first_name = u'Krzysztof' user.last_name = u'Szukiełojć' user.save() …
158 python  mysql  django  unicode  utf-8 

6
u'\ ufeff'在Python字符串中
我收到以下错误消息: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) 不知道是什么u'\ufeff',在我进行网页抓取时会显示出来。我该如何纠正这种情况?该.replace()字符串的方法不能进行这项工作。
152 python  unicode  utf-8 

5
在OS X Lion中,LANG未设置为UTF-8,如何解决?
我尝试在OS X Lion中设置postgress,发现没有正确设置LOCALE环境var。 设置如下: LANG= LC_COLLATE="C" LC_CTYPE="C" LC_MESSAGES="C" LC_MONETARY="C" LC_NUMERIC="C" LC_TIME="C" LC_ALL= 我希望UTF-8有所帮助。这是一个干净的OS X Lion设置,带有西班牙语。我什么也没动。 我不知道如何将其设置为UTF-8。 在终端设置中,检查UTF-8并将LOCALE设置为打开,尽管这样做不起作用。

11
PHP:在不知道原始字符集的情况下将任何字符串转换为UTF-8,或者至少尝试
我有一个与世界各地的客户打交道的应用程序,自然,我希望进入数据库的所有内容都采用UTF-8编码。 对我来说,主要问题是我不知道任何字符串的编码源是什么-它可能来自文本框(<form accept-charset="utf-8">仅在用户实际提交表单时才有用),或者可能是从上传的文本文件中获取,因此我真的无法控制输入。 我需要一个函数或类,以确保进入数据库的内容尽可能采用UTF-8编码。我试过了,iconv(mb_detect_encoding($text), "UTF-8", $text); 但是有问题(如果输入为'fiancée',则返回'fianc')。我已经尝试了很多东西= / 对于文件上传,我喜欢让最终用户指定他们使用的编码,并向他们显示输出结果的预览的想法,但这无助于讨厌的黑客(实际上,这可能会使他们的生活变糟。容易一点)。 我已经阅读了有关该主题的其他SO问题,但是它们似乎都存在细微的差异,例如“我需要解析RSS feed”或“我从网站上抓取数据”(或者实际上是“您不能”)。 但是必须至少尝试一下!

6
如何在C#中将字符串转换为UTF-8?
我有一个从第三方应用程序收到的字符串,我想在Windows Surface上使用C#以任何语言正确显示它。 由于编码不正确,我的一部分字符串在西班牙语中看起来像这样: Acción 而它应该看起来像这样: Acción 根据关于这个问题的答案: 如何知道C#中的字符串编码,我正在接收的编码应该已经在UTF-8上了,但是它是在Encoding.Default(可能是ANSI?)上读取的。 我正在尝试将此字符串转换为真正的UTF-8,但是问题之一是我只能看到Encoding类的一个子集(仅适用于UTF8和Unicode属性),可能是因为我仅限于Windows Surface API。 我尝试了一些在互联网上找到的代码片段,但到目前为止,对于东方语言(例如韩语),它们都没有被证明是成功的。一个示例如下: var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); myString= utf8.GetString(utfBytes, 0, utfBytes.Length); 我还尝试将字符串提取到字节数组中,然后使用UTF8.GetString: byte[] myByteArray = new byte[myString.Length]; for (int ix = 0; ix < myString.Length; ++ix) { char ch = myString[ix]; myByteArray[ix] = (byte) ch; } myString …

22
如何从文件开头删除
我有一个CSS文件,当我使用gedit打开它时看起来不错,但是当PHP读取它(将所有CSS文件合并为一个文件)时,此CSS前面有以下字符: PHP删除了所有空格,因此代码中间的一个随机“ 正如我提到的,当我在gedit中打开文件时,我实际上看不到这些字符,因此我无法轻松地删除它们。 我用谷歌搜索了这个问题,文件编码显然有问题,这是有道理的,因为我一直在通过ftp和rsync用一系列文本编辑器将文件转移到不同的Linux / Windows服务器上。我对字符编码的了解并不多,所以可以帮助您。 如果有帮助,文件将以UTF-8格式保存,而gedit不允许我将其保存为ISO-8859-15格式(文档包含一个或多个无法使用指定字符编码进行编码的字符)。我尝试使用Windows和Linux行尾保存它,但是都没有帮助。

11
更改Python的默认编码?
从控制台运行应用程序时,Python存在许多“无法编码”和“无法解码”的问题。但是在 Eclipse PyDev IDE中,默认字符编码设置为UTF-8,我很好。 我到处搜索以设置默认编码,人们说Python删除了 sys.setdefaultencoding在启动时函数,因此我们无法使用它。 那么什么是最好的解决方案?

5
UTF-8和UTF-16之间的区别?
UTF-8和UTF-16之间的区别?我们为什么需要这些? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
137 java  unicode  utf-8  utf-16  utf 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.