一对单对

98

通常，我发现需要成对处理列表。我想知道哪种方法是有效的pythonic方法，并在Google上找到了它：

pairs = zip(t[::2], t[1::2])

我认为这已经足够好用了，但是在最近涉及成语与效率的讨论之后，我决定进行一些测试：

import time
from itertools import islice, izip

def pairs_1(t):
    return zip(t[::2], t[1::2]) 

def pairs_2(t):
    return izip(t[::2], t[1::2]) 

def pairs_3(t):
    return izip(islice(t,None,None,2), islice(t,1,None,2))

A = range(10000)
B = xrange(len(A))

def pairs_4(t):
    # ignore value of t!
    t = B
    return izip(islice(t,None,None,2), islice(t,1,None,2))

for f in pairs_1, pairs_2, pairs_3, pairs_4:
    # time the pairing
    s = time.time()
    for i in range(1000):
        p = f(A)
    t1 = time.time() - s

    # time using the pairs
    s = time.time()
    for i in range(1000):
        p = f(A)
        for a, b in p:
            pass
    t2 = time.time() - s
    print t1, t2, t2-t1

这些是我计算机上的结果：

1.48668909073 2.63187503815 1.14518594742
0.105381965637 1.35109519958 1.24571323395
0.00257992744446 1.46182489395 1.45924496651
0.00251388549805 1.70076990128 1.69825601578

如果我正确地解释了它们，那应该意味着在Python中实现列表，列表索引和列表切片非常有效。这是令人安慰和意外的结果。

是否有另一种“更好”的成对遍历列表的方式？

请注意，如果列表中元素的数量为奇数，则最后一个元素将不在任何对中。

确保包含所有元素的正确方法是哪种？

我从测试答案中添加了这两个建议：

def pairwise(t):
    it = iter(t)
    return izip(it, it)

def chunkwise(t, size=2):
    it = iter(t)
    return izip(*[it]*size)

结果如下：

0.00159502029419 1.25745987892 1.25586485863
0.00222492218018 1.23795199394 1.23572707176

到目前为止的结果

最pythonic，非常高效：

pairs = izip(t[::2], t[1::2])

最有效且非常pythonic：

pairs = izip(*[iter(t)]*2)

我花了一点时间想知道第一个答案使用了两个迭代器，而第二个答案使用了一个迭代器。

为了处理具有奇数个元素的序列，建议增加原始序列，增加一个元素（None）与之前的最后一个元素配对，这可以通过实现itertools.izip_longest()。

最后

请注意，在Python 3.x中，zip()其行为与itertools.izip()并itertools.izip() 消失了。

— 阿巴拉拉
source

RE：“正确的方法”-没有“正确的方法”！这取决于用例。

— Andrew Jaffe

@Andrew Jaffe在这种情况下，我给出了“最佳”的标准：高效和Pythonic。

— 2011年

@Apalala：我的意思是，具有奇数的结果取决于用法。例如：您可以只保留最后一个元素，或者添加一个特定的已知虚拟元素，或者复制最后一个元素

— Andrew Jaffe

2

@Apalala：因为您使用的是一些巨型包而不是timeit模块。

— SilentGhost

1

正重复：只是在一个快速搜索：stackoverflow.com/questions/4501636，stackoverflow.com/questions/4170295，stackoverflow.com/questions/434287

— tokland

52

我最喜欢的方式：

from itertools import izip

def pairwise(t):
    it = iter(t)
    return izip(it,it)

# for "pairs" of any length
def chunkwise(t, size=2):
    it = iter(t)
    return izip(*[it]*size)

当您要配对所有元素时，您显然可能需要一个fillvalue：

from itertools import izip_longest
def blockwise(t, size=2, fillvalue=None):
    it = iter(t)
    return izip_longest(*[it]*size, fillvalue=fillvalue)

— 约臣·里策尔（Jochen Ritzel）
source

第一个（成对）函数似乎缺少第二个迭代器的克隆和前进。请参阅itertools食谱部分。

— 2011年

@Apalala：zip确实将相同的迭代器前进了两次。

— Jochen Ritzel 2011年

当然，您是对的，而成对配对是迄今为止最有效的，我不知道为什么。

— 2011年

1

我喜欢这种解决方案：它很懒，它利用了迭代器的状态性，从而产生了巨大的效果。您甚至可以将其设置为单线，尽管可能会牺牲可读性：izip(*[iter(t)]*size)

— Channing Moore

对于您的第二个解决方案，您是否要避免在性能提高后创建列表？

— 最大

40

我想说您的初始解决方案pairs = zip(t[::2], t[1::2])是最好的解决方案，因为它最容易阅读（在Python 3中，它会zip自动返回一个迭代器而不是列表）。

为了确保包括所有元素，您可以通过扩展列表None。

然后，如果列表中元素的数量为奇数，则最后一对将为(item, None)。

>>> t = [1,2,3,4,5]
>>> t.append(None)
>>> zip(t[::2], t[1::2])
[(1, 2), (3, 4), (5, None)]
>>> t = [1,2,3,4,5,6]
>>> t.append(None)
>>> zip(t[::2], t[1::2])
[(1, 2), (3, 4), (5, 6)]

— 蒂姆·皮茨克
source

6

我从小的免责声明开始-不要使用下面的代码。根本不是Pythonic，我只是为了好玩而写。它类似于@ THC4k pairwise函数，但使用iter和lambda闭包。它不使用itertools模块，不支持fillvalue。我把它放在这里是因为有人可能会觉得有趣：

pairwise = lambda t: iter((lambda f: lambda: (f(), f()))(iter(t).next), None)

— 托马斯·埃伦特（Tomasz Elendt）
source

3

就大多数pythonic而言，我想说python源文档中提供的食谱（其中一些看起来很像@JochenRitzel提供的答案）可能是您最好的选择；）

def grouper(iterable, n, fillvalue=None):
    "Collect data into fixed-length chunks or blocks"
    # grouper('ABCDEFG', 3, 'x') --> ABC DEF Gxx
    args = [iter(iterable)] * n
    return izip_longest(fillvalue=fillvalue, *args)

— 拍
source

2

是否有另一种“更好”的成对遍历列表的方式？

我不能肯定地说，但我对此表示怀疑：任何其他遍历都会包含更多必须解释的Python代码。诸如zip（）之类的内置函数是用C编写的，这要快得多。

确保包含所有元素的正确方法是哪种？

检查列表的长度，如果它是奇数（len(list) & 1 == 1），则复制列表并附加一个项目。

— 亚伦·迪古拉（Aaron Digulla）
source

2

>>> my_list = [1,2,3,4,5,6,7,8,9,10]
>>> my_pairs = list()
>>> while(my_list):
...     a = my_list.pop(0); b = my_list.pop(0)
...     my_pairs.append((a,b))
... 
>>> print(my_pairs)
[(1, 2), (3, 4), (5, 6), (7, 8), (9, 10)]

— 迪亚米德·奥布赖恩
source

IndexError：从空列表中弹出

— HQuser

@HQuser当然，如果列表中的项目数量奇数，则会出现该错误。您必须确定您有一对或检查此错误情况。

— WaterMolecule

0

只做：

>>> l = [1, 2, 3, 4, 5, 6]
>>> [(x,y) for x,y in zip(l[:-1], l[1:])]
[(1, 2), (2, 3), (3, 4), (4, 5), (5, 6)]

— 以色列Gonçavesde Oliveira
source

您的代码等效于更简单的代码list(zip(l, l[1:]))，它不会将列表分成几对。

— 阿巴拉拉

0

这是使用生成器创建对/腿的示例。生成器不受堆栈限制

def pairwise(data):
    zip(data[::2], data[1::2])

例：

print(list(pairwise(range(10))))

输出：

[(0, 1), (2, 3), (4, 5), (6, 7), (8, 9)]

— 弗拉德·贝兹登
source

比较执行时间？

— 艾伦（Alan）

该列表没有成对出现，因为原始列表中的大多数数字都出现在两个元组中。预期的输出是[(0, 1), (2, 3), (4, 5)....

— 阿帕拉拉

@Apalala感谢您指出。我修复了代码以提供正确的输出

— Vlad Bezden

zip()已经在Python 3.x中返回了生成器，@VladBezden

— Apalala

-1

万一有人需要明智的答案算法，这里是：

>>> def getPairs(list):
...     out = []
...     for i in range(len(list)-1):
...         a = list.pop(0)
...         for j in a:
...             out.append([a, j])
...     return b
>>> 
>>> k = [1, 2, 3, 4]
>>> l = getPairs(k)
>>> l
[[1, 2], [1, 3], [1, 4], [2, 3], [2, 4], [3, 4]]

但是请注意，您原来的列表也将被简化为最后一个元素，因为您使用pop了它。

>>> k
[4]

— 大师
source