Questions tagged «unicode»

Unicode是用于文本编码,表示和处理的标准,旨在支持包含所有书写系统,技术符号和标点符号的书写文本所需的所有字符。

9
在Django中保存Unicode字符串时,MySQL“字符串值不正确”错误
尝试将first_name,last_name保存到Django的auth_user模型时,出现奇怪的错误消息。 失败的例子 user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: '\xC4\x8Dius' for column 'last_name' at row 104 user.first_name = u'Валерий' user.last_name = u'Богданов' user.save() >>> Incorrect string value: '\xD0\x92\xD0\xB0\xD0\xBB...' for column 'first_name' at row 104 user.first_name = u'Krzysztof' user.last_name = u'Szukiełojć' user.save() …
158 python  mysql  django  unicode  utf-8 

3
Python:对Unicode转义的字符串使用.format()
我正在使用Python 2.6.5。我的代码要求使用“大于或等于”符号。它去了: >>> s = u'\u2265' >>> print s >>> ≥ >>> print "{0}".format(s) Traceback (most recent call last): File "<input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\u2265' in position 0: ordinal not in range(128)` 为什么会出现此错误?有正确的方法吗?我需要使用该.format()功能。

6
u'\ ufeff'在Python字符串中
我收到以下错误消息: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) 不知道是什么u'\ufeff',在我进行网页抓取时会显示出来。我该如何纠正这种情况?该.replace()字符串的方法不能进行这项工作。
152 python  unicode  utf-8 



2
字符,代码点,字形和字形之间有什么区别?
试图理解现代Unicode的微妙之处使我很头疼。特别是,代码点,字符,字形和字形之间的区别-在最简单的情况下,使用ASCII字符处理英文文本时,它们之间都是一对一的关系,这些概念给我带来了麻烦。 看到这些术语如何在诸如Matthias Bynens的JavaScript之类的文档中使用unicode问题或Wikipedia关于汉统一的文章时,我收集到这些概念不是一回事,将它们混淆是很危险的,但是我有点努力掌握每个术语的含义。 Unicode联合会提供了一个词汇表来解释这些内容,但是它充满了这样的“定义”: 抽象人物。信息单位,用于组织,控制或表示文本数据。... ... 性格。...(2)抽象字符的同义词。(3)Unicode字符编码的基本编码单位。... ... 字形。(1)代表一个或多个字形图像的抽象形式。(2)字形图像的同义词。在显示Unicode字符数据时,可以选择一个或多个字形来描绘特定字符。 ... 字素。(1)在特定书写系统的情况下,最小区别的书写单位。... 这些定义中的大多数具有听起来很学术和形式化的质量,但是缺乏任何含义的质量,否则将定义问题推迟到标准的另一个词汇表条目或部分。 因此,我寻求那些比我更博学的人的奥秘智慧。这些概念中的每一个究竟有何不同?在什么情况下它们之间不会存在一对一的关系?


13
Python,Unicode和Windows控制台
Наэтотвопросестьответына 堆栈溢出нарусском:Какиз的PythonвывестинаWindows的консольстрокувЮникоде? 当我尝试在Windows控制台中打印Unicode字符串时,出现UnicodeEncodeError: 'charmap' codec can't encode character ....错误。我认为这是因为Windows控制台不接受仅Unicode字符。最好的办法是什么?有什么方法可以使Python自动打印?而不是在这种情况下失败? 编辑: 我正在使用Python 2.5。 注意:带有对勾标记的@ LasseV.Karlsen答案有点过时(自2008年起)。请谨慎使用以下解决方案/答案/建议! 截至今天(2016年1月6日),@ JFSebastian的答案更有意义。
145 python  unicode 

10
Python字符串打印为[u'String']
Наэтотвопросестьответына 堆栈溢出нарусском:покодировкамUTF-8выдаетрезультатпо-разномуприпечатистрокпоотдельностиисписка целиком 这肯定是一件容易的事,但这确实困扰着我。 我有一个脚本,可以读取网页并使用Beautiful Soup对其进行解析。我从汤中提取所有链接,因为我的最终目标是打印出link.contents。 我要解析的所有文本都是ASCII。我知道Python将字符串视为unicode,并且我确信这非常方便,在我的wee脚本中没有用。 每次我去打印一个包含'String'的变量时,我都会被[u'String']打印到屏幕上。是否有一种简单的方法可以将其恢复为ascii,还是应该编写一个正则表达式来删除它?
142 python  unicode  ascii 

8
我可以让git识别UTF-16文件为文本吗?
我正在git中跟踪Virtual PC虚拟机文件(* .vmc),进行更改后git将该文件标识为二进制文件,因此不会对我造成影响。我发现该文件使用UTF-16编码。 可以教git识别该文件是文本并适当处理吗? 我在Cygwin下使用git,将core.autocrlf设置为false。如有必要,我可以在UNIX下使用mSysGit或git。

6
为什么默认编码为ASCII时Python为什么打印unicode字符?
从Python 2.6 shell: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> 我希望在打印语句后出现一些乱码或错误,因为“é”字符不是ASCII的一部分,并且我未指定编码。我想我不明白ASCII是默认编码的意思。 编辑 我将编辑移至“ 答案”部分,并按建议接受。

5
UTF-8和UTF-16之间的区别?
UTF-8和UTF-16之间的区别?我们为什么需要这些? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
137 java  unicode  utf-8  utf-16  utf 

4
NameError:全局名称“ unicode”未定义-在Python 3中
我正在尝试使用一个名为bidi的Python包。在此程序包(algorithm.py)的模块中,尽管它是程序包的一部分,但仍有一些行会给我带来错误。 以下是这些行: # utf-8 ? we need unicode if isinstance(unicode_or_str, unicode): text = unicode_or_str decoded = False else: text = unicode_or_str.decode(encoding) decoded = True 这是错误消息: Traceback (most recent call last): File "<pyshell#25>", line 1, in <module> bidi_text = get_display(reshaped_text) File "C:\Python33\lib\site-packages\python_bidi-0.3.4-py3.3.egg\bidi\algorithm.py", line 602, in get_display if isinstance(unicode_or_str, unicode): NameError: global …

7
URL中的Unicode字符
在2010年,您是否会在大型Web门户中提供包含UTF-8字符的URL? 根据URL上的RFC禁止使用Unicode字符(请参阅此处)。必须对它们进行百分比编码以符合标准。 不过,我的主要目的是提供未编码的字符,其唯一目的是拥有美观的URL,因此百分比编码是可行的。 无论RFC怎么说,所有主流浏览器似乎都可以解析这些URL。不过,我的总体印象是,离开网络浏览器领域时,它变得非常不稳定: URL复制并粘贴到文本文件,电子邮件甚至具有不同编码的网站中 HTTP客户端库 异国情调的浏览器,RSS阅读器 我的印象是正确的,在这里一定会遇到麻烦,因此,如果您正在为非技术受众提供服务,这还不是一个实际的解决方案,并且即使引用和传递所有链接也都能够正常工作,这一点很重要吗? 是否有一些神奇的方法可以在HTML中提供美观的URL http://www.example.com/düsseldorf?neighbourhood=Lörick 可以原样复制并粘贴特殊字符,但是在较旧的客户端中重复使用时可以正常工作吗?
135 html  url  unicode  utf-8 

3
将Unicode字符插入JavaScript
我需要在我的html页面上插入一个Omega(Ω)。我正在使用其HTML转义代码来执行此操作,因此我可以编写Ω并得到Ω。当我将其放入HTML元素时,一切都很好。但是,当我尝试将其放入JS中时,例如var Omega = Ω,它将该代码解析为JS,并且整个过程不起作用。有人知道该怎么做吗?
133 javascript  html  unicode 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.