zip(* [iter(s)] * n)在Python中如何工作?


103
s = [1,2,3,4,5,6,7,8,9]
n = 3

zip(*[iter(s)]*n) # returns [(1,2,3),(4,5,6),(7,8,9)]

zip(*[iter(s)]*n)工作如何?如果用更冗长的代码编写,它将是什么样?


1
也看看这儿,它的工作原理也解释说:stackoverflow.com/questions/2202461/...
马特·乔伊纳

如果这里的答案是不够的,我在这里的博客上它: telliott99.blogspot.com/2010/01/...
telliott99

7
尽管很有趣,但该技术必须与Python的核心“可读性”值背道而驰!
Demis

Answers:


108

iter()是序列上的迭代器。[x] * n产生一个包含n数量的列表x,即一个长度的列表n,其中每个元素都是x*arg将序列解压缩为函数调用的参数。因此,您要向传递3次相同的迭代器zip(),并且每次都会从迭代器中提取一个项目。

x = iter([1,2,3,4,5,6,7,8,9])
print zip(x, x, x)

1
提提要:当迭代器yields(= returns)一个项目时,您可以将其想象为“已消耗”。因此,下次调用迭代器时,它会产生下一个“未使用”的项目。
winklerrr

46

其他出色的答案和注释很好地解释了参数解压缩zip()的作用

就像Ignacioujukatzel所说的那样,您传递了zip()对同一迭代器的三个引用,并zip()从每个引用到迭代器按顺序生成了三元组的整数:

1,2,3,4,5,6,7,8,9  1,2,3,4,5,6,7,8,9  1,2,3,4,5,6,7,8,9
^                    ^                    ^            
      ^                    ^                    ^
            ^                    ^                    ^

并且由于您要求更详细的代码示例:

chunk_size = 3
L = [1,2,3,4,5,6,7,8,9]

# iterate over L in steps of 3
for start in range(0,len(L),chunk_size): # xrange() in 2.x; range() in 3.x
    end = start + chunk_size
    print L[start:end] # three-item chunks

下面的值startend

[0:3) #[1,2,3]
[3:6) #[4,5,6]
[6:9) #[7,8,9]

FWIW,map()初始参数为,您可以获得相同的结果None

>>> map(None,*[iter(s)]*3)
[(1, 2, 3), (4, 5, 6), (7, 8, 9)]

有关更多信息zip(),请访问map()http : //muffinresearch.co.uk/archives/2007/10/16/python-transpose-lists-with-map-and-zip/


31

我认为所有答案中都漏掉了一件事(对熟悉迭代器的人来说可能很明显),而对其他人却不太明显:

由于我们具有相同的迭代器,因此它会被消耗,而其余元素将由zip使用。因此,如果我们仅使用列表而不是迭代器。

l = range(9)
zip(*([l]*3)) # note: not an iter here, the lists are not emptied as we iterate 
# output 
[(0, 0, 0), (1, 1, 1), (2, 2, 2), (3, 3, 3), (4, 4, 4), (5, 5, 5), (6, 6, 6), (7, 7, 7), (8, 8, 8)]

使用迭代器,弹出值并仅保持剩余可用,因此对于zip,一旦消耗了0,则1可用,然后2,依此类推。一件非常微妙的事情,但是非常聪明!!!


+1,您救了我!我不敢相信,假设每个人都知道,其他答案就忽略了这一重要细节。您是否可以参考包含此信息的文档?
Snehasish Karmakar

9

iter(s) 返回s的迭代器。

[iter(s)]*n 使s的n次相同迭代器的列表。

因此,在执行时zip(*[iter(s)]*n),它将从列表中的所有三个迭代器中依次提取一个项目。由于所有迭代器都是同一个对象,因此只将列表分组为n


7
不是“相同列表的n个迭代器”,而是“ n次相同的迭代器对象”。不同的迭代器对象即使在同一列表中也不会共享状态。
Thomas Wouters 2010年

谢谢,改正。确实,那是我在“思考”的东西,但是写了其他东西。
sttwister 2010年

6

关于以这种方式使用zip的一个建议。如果长度不能被整除,它将截断您的列表。要解决此问题,如果可以接受填充值,则可以使用itertools.izip_longest。或者,您可以使用如下所示的内容:

def n_split(iterable, n):
    num_extra = len(iterable) % n
    zipped = zip(*[iter(iterable)] * n)
    return zipped if not num_extra else zipped + [iterable[-num_extra:], ]

用法:

for ints in n_split(range(1,12), 3):
    print ', '.join([str(i) for i in ints])

印刷品:

1, 2, 3
4, 5, 6
7, 8, 9
10, 11

3
itertools食谱中已对此进行了记录:docs.python.org/2/library/itertools.html#recipes grouper。无需重新发明轮子
-jamylak

1

正是看到什么是在Python解释器发生或可能更容易ipython使用n = 2

In [35]: [iter("ABCDEFGH")]*2
Out[35]: [<iterator at 0x6be4128>, <iterator at 0x6be4128>]

因此,我们有两个指向相同迭代器对象的迭代器的列表。请记住,iter在一个对象上返回一个迭代器对象,在这种情况下,由于使用*2python语法糖,它是同一迭代器两次。迭代器也只能运行一次。

此外,zip采用任意数量的可迭代数(序列iterables),并从每个输入序列的第i个元素创建元组。由于在我们的例子中,两个迭代器是相同的,因此zip对于输出的每个2元素元组两次将相同的迭代器移动两次。

In [41]: help(zip)
Help on built-in function zip in module __builtin__:

zip(...)
    zip(seq1 [, seq2 [...]]) -> [(seq1[0], seq2[0] ...), (...)]

    Return a list of tuples, where each tuple contains the i-th element
    from each of the argument sequences.  The returned list is truncated
    in length to the length of the shortest argument sequence.

解包(*)操作者确保迭代器运行至耗尽在这种情况下是,直到没有足够的输入以创建一个2元素的元组。

可以将其扩展为的任何值,nzip(*[iter(s)]*n)按照说明进行操作。


很抱歉,速度太慢。但是您能否解释一下“由于* 2 python语法糖,同一个迭代器两次。迭代器也只能运行一次。” 请分开吗?如果是这样,结果为什么不是[(“ A”,“ A”)....]?谢谢。
刘宝文

@BowenLiu *只是方便地复制对象。尝试使用标量,然后使用列表。也可以尝试print(*zip(*[iter("ABCDEFG")]*2))VS print(*zip(*[iter("ABCDEFG"), iter("ABCDEFG")]))。然后,将它们分解成更小的步骤,以查看两个语句中实际的迭代器对象是什么。
akhan
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.