检查字符串是否以列表中的字符串之一结尾


220

编写以下代码的pythonic方法是什么?

extensions = ['.mp3','.avi']
file_name = 'test.mp3'

for extension in extensions:
    if file_name.endswith(extension):
        #do stuff

我有一个模糊的记忆,for可以避免循环的显式声明,并将其写成if条件。这是真的?


2
尽管这个问题得到了很好的回答,但也许作者本来就想到了if any((file_name.endswith(ext) for ext in extensions))
sapht

Answers:


450

尽管尚不为人所知,str.endswith也接受一个元组。您不需要循环。

>>> 'test.mp3'.endswith(('.mp3', '.avi'))
True

10
您知道为什么它不接受列表但是有元组吗?只是好奇
ilyail3 2016年

2
@falsetru答案中的链接未明确回答该问题。它仅提及它可以接受元组,但没有提及为什么它不能接受列表。由于它们都是序列,因此我可能看到的唯一区别是列表是可变的,而元组是不可变的。我可能是错的,但是我看不到任何其他明确说明原因的原因。
KymikoLoco '17

4
如果要检查字符串是否以字母结尾:import string; str.endswith(tuple(string.ascii_lowercase))
Alex Willison

3
只是一个注释,endswith仅接受python 2.5及更高版本的元组
Akash Singh '18

1
从来不知道!那很完美!
fool4jesus


6

从文件中获取扩展名,然后查看它是否在扩展名集中:

>>> import os
>>> extensions = set(['.mp3','.avi'])
>>> file_name = 'test.mp3'
>>> extension = os.path.splitext(file_name)[1]
>>> extension in extensions
True

使用集合是因为​​集合中查找的时间复杂度为O(1)(docs)。


8
请注意,正如您提到的效率一样,对于较短的元组,.endswith()使用内部元组将比设置查找要快
乔恩·克莱门茨

@JonClements我认为您需要一个特殊的SO金评论徽章,以在答案和问题上做
出色的

罗(Nah)-我只是去买“缠扰的alecxe”徽章;)
乔恩·克莱门茨

2
另请注意,在2.7及更高版本中,您可以使用set的数学语法{'.mp3','.avi'},它避免了额外的类型转换,并且根据您的背景可能更具可读性(“尽管它可能导致与字典混淆,并且不能用于创建空白集)。
珀金斯

@JonClements总有一天我会变得像你一样聪明:)
alecxe

3

有两种方法:正则表达式和字符串(str)方法。

字符串方法通常更快(〜2x)。

import re, timeit
p = re.compile('.*(.mp3|.avi)$', re.IGNORECASE)
file_name = 'test.mp3'
print(bool(t.match(file_name))
%timeit bool(t.match(file_name)

每个循环792 ns±1.83 ns(平均±标准偏差,共7次运行,每个循环1000000次)

file_name = 'test.mp3'
extensions = ('.mp3','.avi')
print(file_name.lower().endswith(extensions))
%timeit file_name.lower().endswith(extensions)

每个循环274 ns±4.22 ns(平均±标准偏差,共7次运行,每个循环1000000次)


1

我有这个:

def has_extension(filename, extension):

    ext = "." + extension
    if filename.endswith(ext):
        return True
    else:
        return False

1
你的意思是return filename.endswith(ext)?:P
Mr_and_Mrs_D

1

我在寻找其他东西时碰到了这个问题。

我建议使用os软件包中的方法。这是因为您可以使其更通用,以补偿任何奇怪的情况。

您可以执行以下操作:

import os

the_file = 'aaaa/bbbb/ccc.ddd'

extensions_list = ['ddd', 'eee', 'fff']

if os.path.splitext(the_file)[-1] in extensions_list:
    # Do your thing.

0

另一种可能是利用IN语句:

extensions = ['.mp3','.avi']
file_name  = 'test.mp3'
if "." in file_name and file_name[file_name.rindex("."):] in extensions:
    print(True)

@ Rainald62,index应该是rindex这种情况。
NeverHopeless

0

可以返回匹配字符串列表的另一种方法是

sample = "alexis has the control"
matched_strings = filter(sample.endswith, ["trol", "ol", "troll"])
print matched_strings
['trol', 'ol']
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.