从字符串中删除数字


120

如何删除字符串中的数字?


19
reresult = re.sub(r'[0-9]+', '', s)
WiktorStribiżew17年

与正则表达式,您将需要添加\。另外,因为我认为它可以是十进制数。像结果= re.sub(r'[0-9 \。] +','',s)
GurhanCagin

1
"\d"在regex中与相同"[0-9]",因此可以result = re.sub(r"\d+", "", s)代替。速度可能取决于所使用的特定字符串,但对我而言,所需re.sub时间大约是它的两倍str.translate(如果您不使用预编译模式,则需要更长的时间)。
内森

Answers:


185

这适合您的情况吗?

>>> s = '12abcd405'
>>> result = ''.join([i for i in s if not i.isdigit()])
>>> result
'abcd'

这利用了列表理解,这里发生的事情与此结构类似:

no_digits = []
# Iterate through the string, adding non-numbers to the no_digits list
for i in s:
    if not i.isdigit():
        no_digits.append(i)

# Now join all elements of the list with '', 
# which puts all of the characters together.
result = ''.join(no_digits)

正如@AshwiniChaudhary和@KirkStrauser指出的那样,您实际上不需要在单行代码中使用括号,从而使括号内的内容成为生成器表达式(比列表理解更有效)。即使这不符合您的分配要求,您最终还是应该阅读以下内容:):

>>> s = '12abcd405'
>>> result = ''.join(i for i in s if not i.isdigit())
>>> result
'abcd'

@SeanJohnson太棒了!我确定我是从该网站上的其他人那里学到的,所以周期完成了:)
RocketDonkey 2012年

@RocketDonkey不需要[]
Ashwini Chaudhary

3
在Python 2.7及更高版本中,您不需要列表理解两边的方括号。您可以忽略它们,它成为生成器表达式。
柯克·斯特拉瑟

固定-谢谢@ AshwiniChaudhary / @ KirkStrauser。
RocketDonkey 2012年

@RocketDonkey也添加了一些解释,只是看到代码对我猜想的OP没有帮助。
Ashwini Chaudhary 2012年

97

而且,经常把它丢进去,是经常被遗忘的str.translate,它比循环/正则表达式快得多:

对于Python 2:

from string import digits

s = 'abc123def456ghi789zero0'
res = s.translate(None, digits)
# 'abcdefghizero'

对于Python 3:

from string import digits

s = 'abc123def456ghi789zero0'
remove_digits = str.maketrans('', '', digits)
res = s.translate(remove_digits)
# 'abcdefghizero'

13
这种方法在Python3中不起作用。改为: 'abc123def456ghi789zero0'.translate({ord(k): None for k in digits})
valignatev

3
最佳Python2解决方案。
严厉的沃登,2013年

不适用于unicode字符串
哈里M

20

不知道您的老师是否允许您使用过滤器,但是...

filter(lambda x: x.isalpha(), "a1a2a3s3d4f5fg6h")

返回-

'aaasdffgh'

比循环更有效率...

例:

for i in range(10):
  a.replace(str(i),'')

1
它返回以下内容:<0x03475FD0处的过滤对象>
lone_coder

5

那这个呢:

out_string = filter(lambda c: not c.isdigit(), in_string)

4
输出为<filter object at 0x7f749e1745c0>。Python3.6
TitanFighter

@TitanFighter您可以通过将过滤器返回的对象包装到list(filter(...))中,将生成器强制为列表对象
ahlusar1989

5

只是几个(其他人建议了其中一些)

方法1:

''.join(i for i in myStr if not i.isdigit())

方法2:

def removeDigits(s):
    answer = []
    for char in s:
        if not char.isdigit():
            answer.append(char)
    return ''.join(char)

方法3:

''.join(filter(lambda x: not x.isdigit(), mystr))

方法4:

nums = set(map(int, range(10)))
''.join(i for i in mystr if i not in nums)

方法5:

''.join(i for i in mystr if ord(i) not in range(48, 58))

2
值得在这些方面进行效率比较。
nu珠穆朗玛峰

2

说st是您的未格式化的字符串,然后运行

st_nodigits=''.join(i for i in st if i.isalpha())

正如刚才提到的。但是我猜想您需要非常简单的内容,所以说s是您的字符串,st_res是没有数字的字符串,那么这是您的代码

l = ['0','1','2','3','4','5','6','7','8','9']
st_res=""
for ch in s:
 if ch not in l:
  st_res+=ch

1

我很乐意使用正则表达式来完成此操作,但是由于您只能使用列表,循环,函数等。

这是我想出的:

stringWithNumbers="I have 10 bananas for my 5 monkeys!"
stringWithoutNumbers=''.join(c if c not in map(str,range(0,10)) else "" for c in stringWithNumbers)
print(stringWithoutNumbers) #I have  bananas for my  monkeys!

1

如果我正确理解您的问题,一种方法是将字符串分解为chars,然后使用循环检查该字符串中的每个char是字符串还是数字,然后将string保存到变量中,然后循环一次完成后,向用户显示


for循环自动遍历字符串的每个字符,因此无需将字符串分解为char。
Ashwini Chaudhary 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.