提取每个子列表的第一项


146

我想知道什么是提取列表列表中每个子列表的第一项并将其附加到新列表的最佳方法。所以,如果我有:

lst = [[a,b,c], [1,2,3], [x,y,z]]

我想退出a1x从中创建一个单独的列表。

我试过了:

lst2.append(x[0] for x in lst)

1
您的代码几乎是正确的。唯一的问题是列表理解的用法。
Abhishek Mittal

Answers:


198

使用列表理解

>>> lst = [['a','b','c'], [1,2,3], ['x','y','z']]
>>> lst2 = [item[0] for item in lst]
>>> lst2
['a', 1, 'x']

列表理解方法也是最快的,甚至比Numpy方法还要快。jboi的答案是关于性能比较的,
张乔

83

您可以使用zip:

>>> lst=[[1,2,3],[11,12,13],[21,22,23]]
>>> zip(*lst)[0]
(1, 11, 21)

或者,Python 3 zip不会产生列表:

>>> list(zip(*lst))[0]
(1, 11, 21)

要么,

>>> next(zip(*lst))
(1, 11, 21)

或者,(我最喜欢的)使用numpy:

>>> import numpy as np
>>> a=np.array([[1,2,3],[11,12,13],[21,22,23]])
>>> a
array([[ 1,  2,  3],
       [11, 12, 13],
       [21, 22, 23]])
>>> a[:,0]
array([ 1, 11, 21])

尚未投票,但第一个代码段(zip)产生:“'zip'对象不可下标”。Jupyter上的Python 3.6。
jboi

@jboi:只需list先将其包装或使用即可next。谢谢
dawg '18年

20

有同样的问题,并对每个解决方案的性能感到好奇。

这是 %timeit

import numpy as np
lst = [['a','b','c'], [1,2,3], ['x','y','z']]

第一种numpy方式,转换数组:

%timeit list(np.array(lst).T[0])
4.9 µs ± 163 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

使用列表理解完全本机(如@alecxe所述):

%timeit [item[0] for item in lst]
379 ns ± 23.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

另一种本机使用方式 zip(如@dawg所述):

%timeit list(zip(*lst))[0]
585 ns ± 7.26 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

第二个numpy方式。也由@dawg解释:

%timeit list(np.array(lst)[:,0])
4.95 µs ± 179 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

令人惊讶的是(至少对我而言)使用列表理解的本机方式最快,并且比numpy方式快约10倍。在没有最终运算的情况下运行两个numpy-way list可以节省大约1 µs,仍然相差10倍。

请注意,当我用调用包围每个代码段len以确保Generators一直运行到最后时,时间保持不变。


4
创建数组时会有很大的开销。
hpaulj

1
同意hpaulj,如果您从numpy数组开始,则[:,0]会更快。试试看:lst = np.array([[''a','b','c'],[1,2,3],['x','y','z']]),然后是lst [:,0]。示例时间试用中的转换为列表理解带来了不公平的优势。因此,如果速度是您的最终目标,请使用numpy数组存储数据。脾气暴躁几乎总是更快。它专为提高速度而设计。
spacedustpi

13

Python包含一个名为itemgetter的函数,用于在列表中的特定索引处返回项目:

from operator import itemgetter

向itemgetter()函数传递要检索的项目的索引。要检索第一个项目,可以使用itemgetter(0)。要了解的重要一点是itemgetter(0)本身会返回一个函数。如果将列表传递给该函数,则会得到特定的项目:

itemgetter(0)([10, 20, 30]) # Returns 10

当将其与map()结合使用时,此功能很有用,后者将一个函数作为其第一个参数,并将列表(或任何其他可迭代)作为第二个参数。它返回在iterable中的每个对象上调用该函数的结果:

my_list = [['a', 'b', 'c'], [1, 2, 3], ['x', 'y', 'z']]
list(map(itemgetter(0), my_list)) # Returns ['a', 1, 'x']

请注意,map()返回一个生成器,因此将结果传递到list()以获取实际列表。总而言之,您的任务可以这样完成:

lst2.append(list(map(itemgetter(0), lst)))

这是使用列表理解的替代方法,选择哪种方法高度依赖于上下文,可读性和偏好。

更多信息:https : //docs.python.org/3/library/operator.html#operator.itemgetter


2

您的代码几乎是正确的。唯一的问题是列表理解的用法。

如果使用like :(对于x在第一个中为x [0]),它将返回一个生成器对象。如果您使用类似:[x [0] for x in lst],它将返回一个列表。

当您将列表理解输出附加到列表时,列表理解的输出是列表的单个元素。

lst = [["a","b","c"], [1,2,3], ["x","y","z"]]
lst2 = []
lst2.append([x[0] for x in lst])
print lst2[0]

lst2 = [['a',1,'x']]

lst2 [0] = ['a',1,'x']

如果我不正确,请告诉我。


1
lst = [['a','b','c'], [1,2,3], ['x','y','z']]
outputlist = []
for values in lst:
    outputlist.append(values[0])

print(outputlist) 

输出: ['a', 1, 'x']


0

您说您有一个现有列表。所以我会去。

>>> lst1 = [['a','b','c'], [1,2,3], ['x','y','z']]
>>> lst2 = [1, 2, 3]

现在,您将把生成器对象附加到第二个列表中。

>>> lst2.append(item[0] for item in lst)
>>> lst2
[1, 2, 3, <generator object <genexpr> at 0xb74b3554>]

但您可能希望它是第一批商品的列表

>>> lst2.append([item[0] for item in lst])
>>> lst2
[1, 2, 3, ['a', 1, 'x']]

现在,我们将第一项列表添加到现有列表中。如果要将项目主题本身(而不是它们的列表)添加到现有主题中,则可以使用list.extend。在那种情况下,我们不必担心添加生成器,因为extend将使用该生成器来添加从那里获取的每个项目,以扩展当前列表。

>>> lst2.extend(item[0] for item in lst)
>>> lst2
[1, 2, 3, 'a', 1, 'x']

要么

>>> lst2 + [x[0] for x in lst]
[1, 2, 3, 'a', 1, 'x']
>>> lst2
[1, 2, 3]

https://docs.python.org/3.4/tutorial/datastructures.html#more-on-lists https://docs.python.org/3.4/tutorial/datastructures.html#list-comprehensions


1
你的回答是不错的,完整的东西它听起来像OP想要的,但我认为这个词append的问题是造成混乱。听起来他/她只是想要解决方案的列表理解部分。
beroe 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.