Questions tagged «encoding»

编码是一组预定义的规则,用于将某种表示形式的信息可逆地转换为完全不同的表示形式。另一种方法称为解码。这个标签相当通用,但是主要用于二进制编码方案,例如base 64和16进制。


10
如何确定文本的编码?
我收到了一些经过编码的文本,但是我不知道使用了什么字符集。有没有一种方法可以使用Python确定文本文件的编码?如何检测 C#处理的文本文件的编码/代码页。

12
在Windows中获取文件的编码
这实际上不是编程问题,是否有命令行或Windows工具(Windows 7)获取文本文件的当前编码?当然可以编写一个小型C#应用程序,但是我想知道是否已经内置了什么?
206 windows  encoding 

8
HTML编码问题-显示“”字符而不是“ ”
由于不确定的原因,我有一个旧版应用程序开始表现异常。它生成一堆HTML,由ActivePDF转换为PDF报告。 该过程如下所示: 从数据库中提取带有替换标记的HTML模板(例如“〜CompanyName〜”,“〜CustomerName〜”等) 用真实数据替换令牌 使用简单的正则表达式函数对HTML进行整理,该函数可对HTML标签属性值进行格式设置(确保引号等,因为ActivePDF的呈现引擎只讨厌属性值周围的单引号) 将HTML发送到创建PDF的Web服务。 在混乱的某个地方,HTML模板( s)中的不间断空格被编码为ISO-8859-1,因此当在浏览器(FireFox)中查看文档时,它们会错误地显示为“”字符。ActivePDF会戳这些非UTF8字符。 我的问题是:由于我不知道问题源于何处并且没有时间进行调查,是否有一种简单的方法可以重新编码或查找和替换不良字符?我试图通过我一起放的这个小功能来发送它,但是这一切都变成了gobbledegook并没有改变任何东西。 Private Shared Function ConvertToUTF8(ByVal html As String) As String Dim isoEncoding As Encoding = Encoding.GetEncoding("iso-8859-1") Dim source As Byte() = isoEncoding.GetBytes(html) Return Encoding.UTF8.GetString(Encoding.Convert(isoEncoding, Encoding.UTF8, source)) End Function 有任何想法吗? 编辑: 我现在暂时解决这个问题,尽管这似乎不是一个好的解决方案: Private Shared Function ReplaceNonASCIIChars(ByVal html As String) As String Return Regex.Replace(html, "[^\u0000-\u007F]", …


11
尝试将非属性列表对象设置为NSUserDefaults
我以为我知道导致此错误的原因,但是我似乎无法弄清楚自己做错了什么。 这是我收到的完整错误消息: 尝试设置非属性列表对象( “ <BC_Person:0x8f3c140>” )作为keyUserDataArray的NSUserDefaults值 我有一个Person我认为符合该NSCoding协议的类,在我的person类中同时拥有这两种方法: - (void)encodeWithCoder:(NSCoder *)coder { [coder encodeObject:self.personsName forKey:@"BCPersonsName"]; [coder encodeObject:self.personsBills forKey:@"BCPersonsBillsArray"]; } - (id)initWithCoder:(NSCoder *)coder { self = [super init]; if (self) { self.personsName = [coder decodeObjectForKey:@"BCPersonsName"]; self.personsBills = [coder decodeObjectForKey:@"BCPersonsBillsArray"]; } return self; } 在应用中的某一时刻,NSString在BC_PersonClass设置,我有一个DataSave一流的,我认为是在处理我的编码性能BC_PersonClass。这是我在DataSave该类中使用的代码: - (void)savePersonArrayData:(BC_Person *)personObject { // NSLog(@"name of the …

22
Microsoft Excel在.csv文件中破坏了变音符号?
我正在以编程方式将数据(使用PHP 5.2)导出到.csv测试文件中。 示例数据:( Numéro 1注意带重音符号的e)。数据为utf-8(无前置BOM)。 当我在MS Excel中打开此文件时,显示为Numéro 1。 我可以在正确显示它的文本编辑器(UltraEdit)中打开它。UE报告该字符为decimal 233。 如何导出 .csv文件中的文本数据,以便MS Excel正确呈现文本数据(最好不强制使用导入向导或非默认向导设置)?

1
让JSON对象接受字节或让urlopen输出字符串
使用Python 3,我需要从URL请求json文档。 response = urllib.request.urlopen(request) 该response对象是带有read和readline方法的类似文件的对象。通常,可以使用在文本模式下打开的文件来创建JSON对象。 obj = json.load(fp) 我想做的是: obj = json.load(response) 但是,此方法不起作用,因为urlopen以二进制模式返回文件对象。 解决方法当然是: str_response = response.read().decode('utf-8') obj = json.loads(str_response) 但这感觉不好... 有没有更好的方法可以将字节文件对象转换为字符串文件对象?还是我缺少任何一个参数urlopen或json.load给出编码?

15
如何确定OS X中的文件编码?
我正在尝试在TextMate的LaTeX文件中输入一些UTF-8字符(它的默认编码为UTF-8),但是LaTeX似乎不理解它们。 运行可以cat my_file.tex在终端中正确显示字符。运行ls -al显示了我从未见过的东西:文件列表旁边的“ @”: -rw-r--r--@ 1 me users 2021 Feb 11 18:05 my_file.tex (是的,我正在\usepackage[utf8]{inputenc}LaTeX中使用。) 我发现了iconv,但似乎无法告诉我编码是什么-只有在弄清楚后才会转换。
170 macos  encoding  latex  utf-8 


6
定义Python源代码编码的正确方法
PEP 263定义了如何声明Python源代码编码。 通常,Python文件的前两行应以: #!/usr/bin/python # -*- coding: <encoding name> -*- 但是我看过很多以以下内容开头的文件: #!/usr/bin/python # -*- encoding: <encoding name> -*- => 编码而不是编码。 那么,声明文件编码的正确方法是什么? 是否允许使用编码,因为使用的正则表达式是惰性的?还是仅仅是声明文件编码的另一种形式? 我问这个问题是因为PEP不在谈论编码,它只是在谈论编码。
163 python  encoding 

10
在Python中序列化JSON时,“ TypeError :(整数)不可JSON序列化”?
我正在尝试从python发送一个简单的字典到json文件,但是我一直收到“ TypeError:1425不能序列化JSON”消息。 import json alerts = {'upper':[1425],'lower':[576],'level':[2],'datetime':['2012-08-08 15:30']} afile = open('test.json','w') afile.write(json.dumps(alerts,encoding='UTF-8')) afile.close() 如果我添加默认参数,则它将写入,但是整数值将作为字符串写入json文件,这是不可取的。 afile.write(json.dumps(alerts,encoding='UTF-8',default=str))

11
编码和字符集有什么区别?
我对文本编码和字符集感到困惑。由于许多原因,我在接下来的工作中必须学习非Unicode,非UTF8的知识。 我在电子邮件标头中找到了“ charset”一词,就像在“ ISO-2022-JP”中那样,但是在文本编辑器中没有这样的编码。(我环顾了不同的文本编辑器。) 文本编码和字符集有什么区别?如果您可以向我展示一些用例示例,我将不胜感激。

5
在OS X Lion中,LANG未设置为UTF-8,如何解决?
我尝试在OS X Lion中设置postgress,发现没有正确设置LOCALE环境var。 设置如下: LANG= LC_COLLATE="C" LC_CTYPE="C" LC_MESSAGES="C" LC_MONETARY="C" LC_NUMERIC="C" LC_TIME="C" LC_ALL= 我希望UTF-8有所帮助。这是一个干净的OS X Lion设置,带有西班牙语。我什么也没动。 我不知道如何将其设置为UTF-8。 在终端设置中,检查UTF-8并将LOCALE设置为打开,尽管这样做不起作用。

9
为什么PHP json_encode函数将UTF-8字符串转换为十六进制实体?
我有一个处理多种语言的PHP脚本。不幸的是,每当我尝试使用时json_encode,任何Unicode输出都将转换为十六进制实体。这是预期的行为吗?有什么方法可以将输出转换为UTF-8字符? 这是我所看到的示例: 输入 echo $text; 输出值 База данни грешка. 输入 json_encode($text); 输出值 "\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."
148 php  encoding  json 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.