不区分大小写的列表排序,而不降低结果大小?


133

我有一个这样的字符串列表:

['Aden', 'abel']

我要对项目排序,不区分大小写。所以我想得到:

['abel', 'Aden']

但与sorted()或相反list.sort(),因为大写字母先于小写字母。

我如何忽略这种情况?我已经看到了涉及降低所有列表项的解决方案,但是我不想更改列表项的大小写。


Answers:


192

在Python 3.3+中,有str.casefold一种专为无条件匹配而设计的方法:

sorted_list = sorted(unsorted_list, key=str.casefold)

在Python 2中使用lower()

sorted_list = sorted(unsorted_list, key=lambda s: s.lower())

它适用于普通字符串和unicode字符串,因为它们都有lower方法。

在Python 2中,它可以将普通字符串和unicode字符串混合使用,因为这两种类型的值可以相互比较。但是,Python 3并不是这样工作的:您无法比较字节字符串和unicode字符串,因此在Python 3中,您应该做明智的事情,并且只能对一种类型的字符串列表进行排序。

>>> lst = ['Aden', u'abe1']
>>> sorted(lst)
['Aden', u'abe1']
>>> sorted(lst, key=lambda s: s.lower())
[u'abe1', 'Aden']

11
人们可以通过避免lambda函数往返(Python 3中)使用一般str.lower作为函数sorted(lst, key=str.lower)(Python的2)使用lower所述的方法string模块作为sorted(lst, key=string.lower)。一个人也可以str.lower在Python 2中用于字符串,但随后必须unicode.lower用于unicode对象,而同时string.lower接受两个对象(正如您所说的那样,实际上可能并不是一种“理智”的操作模式)。
Daniel Andersson

对于像['Z','B','a','b','A']之类的列表,该列表排序为['a','A','B','b', 'Z']。大写字母“ B”出现在小写字母“ b”之前,因为当字符串匹配时,Python的sort()和sorted()保留了原始顺序。在这种情况下,使用大小写折叠时,大写字母“ B”被认为与小写字母“ b”匹配。如果为了进行比较而转换大小写,则总是会发生这种情况:sorted(spam,key = str.lower)或sorted(spam,key = str.upper)或sorted(spam,key = str.casefold)。
PJ辛格

请尝试以下解决方案:stackoverflow.com/a/1098160/10668287。它将正确地将['Aden','aden']排序为['aden','Aden']。
PJ辛格

46
>>> x = ['Aden', 'abel']
>>> sorted(x, key=str.lower) # Or unicode.lower if all items are unicode
['abel', 'Aden']

在Python 3中str是unicode,但在Python 2中,您可以使用这种更通用的方法,该方法对str和都适用unicode

>>> sorted(x, key=lambda s: s.lower())
['abel', 'Aden']

谢谢。我知道我以前应该提到这一点,但是我听说在Unicode字符串(Py2)上使用此方法存在问题。你对此一无所知吗?

它们都是unicode。谢谢!另一个问题,如何在像这样的列表上做:[['Aden'], ['abel']]

每个列表中只有一项吗?如果是这样,只需将其修改为:sorted(x,key=lambda i:i[0].lower())
jamylak

好吧,它可能还有其他一些东西,但是不应该用于排序。

1
没关系,似乎我错了,排序确实适用于字符串和unicode的混合,我与先前的问题混淆了,在该问题中元组也包括在排序中。
jamylak 2012年



3

在python3中,您可以使用

list1.sort(key=lambda x: x.lower()) #Case In-sensitive             
list1.sort() #Case Sensitive

1

我是通过Python 3.3做到的:

 def sortCaseIns(lst):
    lst2 = [[x for x in range(0, 2)] for y in range(0, len(lst))]
    for i in range(0, len(lst)):
        lst2[i][0] = lst[i].lower()
        lst2[i][1] = lst[i]
    lst2.sort()
    for i in range(0, len(lst)):
        lst[i] = lst2[i][1]

然后,您可以调用此函数:

sortCaseIns(yourListToSort)

0

不区分大小写的排序,在Python 2 OR 3中对字符串进行排序(在Python 2.7.17和Python 3.6.9中测试):

>>> x = ["aa", "A", "bb", "B", "cc", "C"]
>>> x.sort()
>>> x
['A', 'B', 'C', 'aa', 'bb', 'cc']
>>> x.sort(key=str.lower)           # <===== there it is!
>>> x
['A', 'aa', 'B', 'bb', 'C', 'cc']

关键是key=str.lower。这些命令只是这些命令的外观,以便于复制粘贴,因此您可以对其进行测试:

x = ["aa", "A", "bb", "B", "cc", "C"]
x.sort()
x
x.sort(key=str.lower)
x

请注意,但是,如果您的字符串是unicode字符串(如u'some string'),则仅在Python 2中(在这种情况下,在Python 3中不是),上述x.sort(key=str.lower)命令将失败并输出以下错误:

TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode'

如果出现此错误,请升级到Python 3来处理unicode排序,或者先使用列表推导将unicode字符串转换为ASCII字符串,如下所示:

# for Python2, ensure all elements are ASCII (NOT unicode) strings first
x = [str(element) for element in x]  
# for Python2, this sort will only work on ASCII (NOT unicode) strings
x.sort(key=str.lower)

参考文献:

  1. https://docs.python.org/3/library/stdtypes.html#list.sort
  2. 将Unicode字符串转换为Python中的字符串(包含多余的符号)
  3. https://www.programiz.com/python-programming/list-comprehension

-3

试试这个

def cSort(inlist, minisort=True):
    sortlist = []
    newlist = []
    sortdict = {}
    for entry in inlist:
        try:
            lentry = entry.lower()
        except AttributeError:
            sortlist.append(lentry)
        else:
            try:
                sortdict[lentry].append(entry)
            except KeyError:
                sortdict[lentry] = [entry]
                sortlist.append(lentry)

    sortlist.sort()
    for entry in sortlist:
        try:
            thislist = sortdict[entry]
            if minisort: thislist.sort()
            newlist = newlist + thislist
        except KeyError:
            newlist.append(entry)
    return newlist

lst = ['Aden', 'abel']
print cSort(lst)

输出量

['abel', 'Aden']


9
当一个衬套就足够时,这种解决方案就显得过分杀人并且不可读。这可能是除Python之外的其他语言所接受的。
IceArdor 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.