Questions tagged «ascii»

基于英语字母顺序的字符编码方案。ASCII代表美国信息交换标准代码。

9
(grep)正则表达式以匹配非ASCII字符?
在Linux上,我有一个包含大量文件的目录。其中一些具有非ASCII字符,但它们都是有效的UTF-8。一个程序有一个错误,阻止它与非ASCII文件名一起使用,我必须找出有多少受影响。我打算这样做find,然后执行grep打印非ASCII字符,然后执行a wc -l查找数字。不必是grep;我可以使用任何标准的Unix 正则表达式,例如Perl,sed,AWK等。 但是,是否存在“不是ASCII字符的任何字符”的正则表达式?
169 regex  unicode  grep  ascii 


10
^ = 32背后的想法是什么,将小写字母转换为大写字母,反之亦然?
我正在解决代码部队上的一些问题。通常我首先检查字符是大写还是小写英文字母,然后减去或加上32以将其转换为相应的字母。但是我发现有人会^= 32做同样的事情。这里是: char foo = 'a'; foo ^= 32; char bar = 'A'; bar ^= 32; cout << foo << ' ' << bar << '\n'; // foo is A, and bar is a 我已经搜索了对此的解释,但没有找到。那为什么行得通呢?


10
Python字符串打印为[u'String']
Наэтотвопросестьответына 堆栈溢出нарусском:покодировкамUTF-8выдаетрезультатпо-разномуприпечатистрокпоотдельностиисписка целиком 这肯定是一件容易的事,但这确实困扰着我。 我有一个脚本,可以读取网页并使用Beautiful Soup对其进行解析。我从汤中提取所有链接,因为我的最终目标是打印出link.contents。 我要解析的所有文本都是ASCII。我知道Python将字符串视为unicode,并且我确信这非常方便,在我的wee脚本中没有用。 每次我去打印一个包含'String'的变量时,我都会被[u'String']打印到屏幕上。是否有一种简单的方法可以将其恢复为ascii,还是应该编写一个正则表达式来删除它?
142 python  unicode  ascii 

6
为什么默认编码为ASCII时Python为什么打印unicode字符?
从Python 2.6 shell: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> 我希望在打印语句后出现一些乱码或错误,因为“é”字符不是ASCII的一部分,并且我未指定编码。我想我不明白ASCII是默认编码的意思。 编辑 我将编辑移至“ 答案”部分,并按建议接受。

5
将int转换为ASCII并返回Python
我正在为我的站点制作URL缩短器,而我目前的计划(我愿意接受建议)是使用节点ID来生成缩短的URL。因此,从理论上讲,节点26可能是short.com/z,节点1可能是short.com/a,节点52可能是short.com/Z,节点104可能是short.com/ZZ。当用户转到该URL时,我需要撤消该过程(显然)。 我可以想到一些可行的方法来解决此问题,但我想还有更好的方法。有什么建议?
137 python  integer  ascii  encode 



12
Java中的“编码不可映射字符”警告
我目前正在研究一个Java项目,该项目在编译时会发出以下警告: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; 我不确定SO将如何在日期之前呈现该字符,但是它应该是版权符号,并在警告中以菱形问号显示。 值得注意的是,该字符正确地出现在输出工件中,但是警告令人讨厌,并且文本编辑器可能有一天会触摸包含此类的文件,该文本编辑器会错误地保存编码... 如何将这个字符注入“版权”字符串中,以便编译器满意,并且将符号保留在文件中而没有潜在的重新编码问题?
112 java  encoding  utf-8  ascii 


15
如何在C#中获取字符串的ASCII值
我想在C#中获取字符串中字符的ASCII值。 如果我的字符串的值为“ 9quali52ty3”,则我需要一个包含11个字符中每个字符的ASCII值的数组。 如何在C#中获取ASCII值?
108 c#  encoding  ascii 

9
Python Unicode编码错误
我正在读取和解析Amazon XML文件,而当XML文件显示'时,尝试打印该文件时,出现以下错误: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) 从到目前为止的在线阅读中,该错误是由于XML文件位于UTF-8中引起的,但是Python希望将其作为ASCII编码字符进行处理。有没有简单的方法可以使错误消失并让我的程序在读取时打印XML?
104 python  unicode  ascii  encode 

8
用Python从文件中读取字符
在文本文件中,有一个字符串“我不喜欢这样”。 但是,当我将其读取为字符串时,它变成“我不这样\ xe2 \ x80 \ x98t”。我了解\ u2018是“'”的Unicode表示形式。我用 f1 = open (file1, "r") text = f1.read() 命令来做阅读。 现在,是否可以以这样的方式读取字符串,即当将其读入字符串时,它是“我不喜欢这样”而不是“我不喜欢这样”吗? 第二编辑:我已经看到有人使用映射来解决此问题,但实际上,没有内置的转换可以将这种ANSI转换为unicode(反之亦然)吗?

7
如何使用Python删除非ASCII字符但保留句点和空格?
我正在使用.txt文件。我希望文件中的文本字符串不包含非ASCII字符。但是,我想留空格和句点。目前,我也正在剥离它们。这是代码: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') data=f.read() f.close() filtered_data=filter(onlyascii, data) filtered_data = filtered_data.lower() return filtered_data 我应该如何修改onlyascii()以保留空格和句点?我想这并不太复杂,但我无法弄清楚。
100 python  text  unicode  filter  ascii 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.