如何按给定索引处的元素对列表/元组的列表/元组进行排序？

657

我在列表列表或元组列表中都有一些数据，如下所示：

data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]

我想按子集中的第二个元素排序。这意味着，由2,5,8，其中排序2是(1,2,3)，5是从(4,5,6)。常见的做法是什么？我应该将元组或列表存储在列表中吗？

— 斯坦
source

51

关于“我应该在列表中存储元组还是列表？”的经验法则是使事物尽可能不变。如果不需要就地修改子列表，请使其成为元组。

— 马修·弗拉申

1112

sorted_by_second = sorted(data, key=lambda tup: tup[1])

要么：

data.sort(key=lambda tup: tup[1])  # sorts in place

— 史提芬
source

10

任何想法如何将其从大到小排序？

— billwild 2012年

63

@billwild：帮助（排序）。反向=真。

— 斯蒂芬

34

@Stephen使用itemgetter更快，更简单：key=itemgetter(1)并且在文件开头：from operator import itemgetter

— Joschua 2013年

3

对于第二个示例，@Cemre，sort这是ListPython对象的方法，该方法接收lambda函数作为其key参数。您可以将其命名为tup，或t，也可以命名为任意名称，并且仍然可以使用。tup这里指定列表元组的索引，因此1意味着将按照原始列表（2, 5, 8）中元组的第二个值进行排序。

— 神经递质

1

我对未经证实的说法“使用itemgetter更快，更简单”表示怀疑。尽管我主观地认为直观lambda方法比不直观的itemgetter类更简单，itemgetter 但确实确实更快。我很好奇为什么会这样。我的粗略怀疑是，将lambda所有局部变量捕获到闭包上下文中会产生隐性成本，而itemgetter实例则不会。tl; dr：始终使用itemgetter，因为速度是胜利。

— 塞西尔·库里

236

from operator import itemgetter
data.sort(key=itemgetter(1))

— 马诺娃
source

37

这应该是公认的答案。又见查理的发布时机，充分展示了itemgetter类排序快126％，平均比同等lambda功能。

— 塞西尔·库里

9

您还可以按多个索引进行分层排序，例如data.sort(key=itemgetter(3,1))

— Michael Ohlrogge

57

如果您想将数组从高到低排序，我只想添加到Stephen的答案中，除了上面的注释中的另一种方法就是将其添加到行中：

reverse = True

结果将如下所示：

data.sort(key=lambda tup: tup[1], reverse=True)

— 西富
source

48

为了按照多个条件进行排序，例如按元组中的第二个和第三个元素进行排序，

data = [(1,2,3),(1,2,1),(1,1,4)]

并定义一个lambda来返回描述优先级的元组，例如

sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]

— 榆树
source

28

斯蒂芬的答案就是我会用的答案。为了完整起见，这是带有列表推导的DSU（装饰-排序-取消装饰）模式：

decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]

或者，更简洁地说：

[b for a,b in sorted((tup[1], tup) for tup in data)]

如Python Sorting HowTo中所述，自Python 2.4启用关键功能以来，就没有必要这样做。

— car
source

2

所以这个答案对Python 2.3-有用吗？在最新的Python版本中是否有任何有效的用法，您可能会在后面详细阐述吗？如果没有的话，就没有麻烦……只是路过，看到了这一点，那只旧的头皮就一点点搅拌了。无论如何，为此加油并感谢您回到Python的早期时代。

— mechanical_meat

19

为了对元组列表进行排序(<word>, <count>)，以count降序和word字母顺序：

data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]

我使用这种方法：

sorted(data, key=lambda tup:(-tup[1], tup[0]))

它给了我结果：

[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]

— 明志
source

1

如果tup [1]是字符串怎么办？

— eric

12

没有lambda：

def sec_elem(s):
    return s[1]

sorted(data, key=sec_elem)

— 梅斯科
source

9

itemgetter() 比...快一点 lambda tup: tup[1]，但增长幅度相对较小（大约10％到25％）。

（IPython会话）

>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [tuple(values[i,:]) for i in range(len(values))]

>>> tpls[:5]    # display sample from list
[(1, 0, 0), 
 (8, 5, 5), 
 (5, 4, 0), 
 (5, 7, 7), 
 (4, 2, 1)]

>>> sorted(tpls[:5], key=itemgetter(1))    # example sort
[(1, 0, 0), 
 (4, 2, 1), 
 (5, 4, 0), 
 (8, 5, 5), 
 (5, 7, 7)]

>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop

>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop

— 沃尔特
source

请参阅itemgetter分拣解决方案改变这里的多列反向参数，然后你需要安排您的排序在多个步骤一排：stackoverflow.com/questions/14466068/...

— 洛伦茨

6

@Stephen的答案很关键！这是一个更好的可视化示例，

为Ready Player One粉丝大喊大叫！=）

>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]

key是一个函数，将调用该函数来转换集合的项目以进行比较compareTo。

传递给key的参数必须是可调用的。在这里，使用lambdacreate创建一个匿名函数（可调用）。
lambda的语法是单词lambda，后跟一个可迭代的名称，然后是单个代码块。

在下面的示例中，我们正在对元组列表进行排序，该元组列表包含某些事件和演员名称的信息记录时间。

我们按照事件发生的时间对该列表进行排序-这是元组的第0个元素。

注意- s.sort([cmp[, key[, reverse]]]) 将s的项目排序到位

— 里士
source

-5

对元组进行排序非常简单：

tuple(sorted(t))

— 杰尔
source