Questions tagged «character-encoding»

字符编码是指将字符表示为一系列字节的方式。Web的字符编码在编码标准中定义。


3
如何从文本文件中删除非UTF-8字符
我有一堆用utf-8编码的阿拉伯文,英文,俄文文件。尝试使用Perl脚本处理这些文件时,出现以下错误: Malformed UTF-8 character (fatal) 手动检查这些文件的内容,发现它们中有一些奇怪的字符。现在,我正在寻找一种自动从文件中删除这些字符的方法。 反正有做吗?


1
不支持Python解码Unicode
我在Python中的编码有问题。我尝试了不同的方法,但似乎找不到找到将输出编码为UTF-8的最佳方法。 这就是我想要做的: result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGoogle传回的第一个Google结果param。 这是我得到的错误: exceptions.TypeError: decoding Unicode is not supported 有谁知道我该如何使Python用UTF-8编码输出以避免这种错误?

3
Java:将字符串与ByteBuffer相互转换以及相关问题
我正在使用Java NIO进行套接字连接,并且我的协议是基于文本的,因此我需要能够将字符串转换为ByteBuffer,然后再将其写入SocketChannel,并将传入的ByteBuffer转换回String。目前,我正在使用以下代码: public static Charset charset = Charset.forName("UTF-8"); public static CharsetEncoder encoder = charset.newEncoder(); public static CharsetDecoder decoder = charset.newDecoder(); public static ByteBuffer str_to_bb(String msg){ try{ return encoder.encode(CharBuffer.wrap(msg)); }catch(Exception e){e.printStackTrace();} return null; } public static String bb_to_str(ByteBuffer buffer){ String data = ""; try{ int old_position = buffer.position(); data = decoder.decode(buffer).toString(); …


18
FPDF utf-8编码(HOW-TO)
有人知道如何将FPDF软件包中的编码设置为utf-8吗?或至少是支持希腊字符的ISO-8859-7(希腊文)? 基本上我想创建一个包含希腊字符的pdf文件。 任何建议都会有所帮助。乔治



8
如何检测文本文件的字符编码?
我尝试检测文件中使用了哪种字符编码。 我尝试使用此代码来获取标准编码 public static Encoding GetFileEncoding(string srcFile) { // *** Use Default of Encoding.Default (Ansi CodePage) Encoding enc = Encoding.Default; // *** Detect byte order mark if any - otherwise assume default byte[] buffer = new byte[5]; FileStream file = new FileStream(srcFile, FileMode.Open); file.Read(buffer, 0, 5); file.Close(); if (buffer[0] == …

5
UTF-8字符有问题;我看到的不是我存储的
我试图使用UTF-8遇到麻烦。 我尝试了很多事情;这是我得到的结果: ????而不是亚洲字符。即使是欧洲文字,我也能Se?or接受Señor。 奇怪的乱码(变为乱码?),如Señor或新浪新闻为新浪新闻。 黑钻石,例如Seor。 最终,我陷入了数据丢失或至少被截断的情况:Sefor Señor。 即使我看到正确的文本,它也无法正确排序。 我究竟做错了什么?我该如何修复代码?我可以恢复数据吗?

10
UTL8与STL中的宽字符转换
是否可以以平台无关的方式将std :: string中的UTF8字符串转换为std :: wstring,反之亦然?在Windows应用程序中,我将使用MultiByteToWideChar和WideCharToMultiByte。但是,代码是为多个操作系统编译的,我仅限于标准C ++库。

3
如何从C#中的ASCII字符代码获取字符
我试图在c#中解析一个文件,该文件具有由ascii字符代码0、1和2分隔的字段(字符串)数组(在Visual Basic 6中,您可以使用Chr(0)或Chr(1)等生成这些文件) 我知道对于C#中的字符代码0,您可以执行以下操作: char separator = '\0'; 但这不适用于字符代码1和2?


9
HMAC-SHA256签名计算算法
我正在尝试使用HMAC-SHA256算法创建签名,这是我的代码。我正在使用美国ASCII编码。 final Charset asciiCs = Charset.forName("US-ASCII"); final Mac sha256_HMAC = Mac.getInstance("HmacSHA256"); final SecretKeySpec secret_key = new javax.crypto.spec.SecretKeySpec(asciiCs.encode("key").array(), "HmacSHA256"); final byte[] mac_data = sha256_HMAC.doFinal(asciiCs.encode("The quick brown fox jumps over the lazy dog").array()); String result = ""; for (final byte element : mac_data) { result += Integer.toString((element & 0xff) + 0x100, 16).substring(1); …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.