列表理解和生成器表达式的收益


76

以下行为对我来说似乎很违反直觉(Python 3.4):

>>> [(yield i) for i in range(3)]
<generator object <listcomp> at 0x0245C148>
>>> list([(yield i) for i in range(3)])
[0, 1, 2]
>>> list((yield i) for i in range(3))
[0, None, 1, None, 2, None]

最后一行的中间值实际上并不总是None,它们是send生成器中使用的值,相当于(我想)以下生成器:

def f():
   for i in range(3):
      yield (yield i)

这三行代码完全起作用使我感到很有趣。该参考指出,yield仅在一个函数定义允许的(虽然我可能读错和/或它可能只是已经从旧版本复制)。前两行在SyntaxErrorPython 2.7中产生a ,但第三行却没有。

而且,这似乎很奇怪

  • 列表理解返回一个生成器而不是一个列表
  • 并且生成器表达式转换为列表以及相应的列表理解包含不同的值。

有人可以提供更多信息吗?

Answers:


75

注意:这是CPython处理incomprehensionyield和生成器表达式中的错误,已在Python 3.8中修复,并在Python 3.7中弃用了警告。请参阅Python错误报告Python 3.7Python 3.8的新增功能条目。

生成器表达式以及set和dict理解将编译为(生成器)函数对象。在Python 3中,列表推导得到相同的处理。从本质上讲,它们都是一个新的嵌套范围。

如果尝试反汇编生成器表达式,则可以看到以下内容:

>>> dis.dis(compile("(i for i in range(3))", '', 'exec'))
  1           0 LOAD_CONST               0 (<code object <genexpr> at 0x10f7530c0, file "", line 1>)
              3 LOAD_CONST               1 ('<genexpr>')
              6 MAKE_FUNCTION            0
              9 LOAD_NAME                0 (range)
             12 LOAD_CONST               2 (3)
             15 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             18 GET_ITER
             19 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             22 POP_TOP
             23 LOAD_CONST               3 (None)
             26 RETURN_VALUE
>>> dis.dis(compile("(i for i in range(3))", '', 'exec').co_consts[0])
  1           0 LOAD_FAST                0 (.0)
        >>    3 FOR_ITER                11 (to 17)
              6 STORE_FAST               1 (i)
              9 LOAD_FAST                1 (i)
             12 YIELD_VALUE
             13 POP_TOP
             14 JUMP_ABSOLUTE            3
        >>   17 LOAD_CONST               0 (None)
             20 RETURN_VALUE

上面显示了生成器表达式已编译为代码对象,并作为函数加载(MAKE_FUNCTION从代码对象创建函数对象)。该.co_consts[0]引用使我们可以看到为表达式生成的代码对象,并且它的用法YIELD_VALUE与生成器函数一样。

这样,该yield表达式在该上下文中起作用,因为编译器将它们视为伪装函数。

这是一个错误;yield在这些表达式中没有位置。Python 3.7之前的Python语法允许它使用(这就是为什么代码可编译的原因),但是yield表达式规范表明使用yield此处实际上不起作用:

yield表达式仅在定义生成器函数时使用,因此只能在函数定义的主体中使用。

已确认这是问题10544中的错误。该bug的解决方案是在Python 3.8中使用yieldyield from引发一个SyntaxError错误; 在Python 3.7中,它提出了一个DeprecationWarning以确保代码停止使用此构造。如果您使用启用了Python 3兼容性警告的-3命令行开关,则会在Python 2.7.15及更高版本中看到相同的警告。

3.7.0b1警告看起来像这样;将警告变成错误会给您一个SyntaxError例外,就像3.8中那样:

>>> [(yield i) for i in range(3)]
<stdin>:1: DeprecationWarning: 'yield' inside list comprehension
<generator object <listcomp> at 0x1092ec7c8>
>>> import warnings
>>> warnings.simplefilter('error')
>>> [(yield i) for i in range(3)]
  File "<stdin>", line 1
SyntaxError: 'yield' inside list comprehension

如何之间的差异yield列表中的理解和yield在发电机运转的表达在这两个表达式是如何实现的差异造成的。在Python 3中,列表推导使用LIST_APPEND调用将堆栈顶部添加到要构建的列表中,而生成器表达式则产生该值。添加(yield <expr>)只是YIELD_VALUE向其中一个添加另一个操作码:

>>> dis.dis(compile("[(yield i) for i in range(3)]", '', 'exec').co_consts[0])
  1           0 BUILD_LIST               0
              3 LOAD_FAST                0 (.0)
        >>    6 FOR_ITER                13 (to 22)
              9 STORE_FAST               1 (i)
             12 LOAD_FAST                1 (i)
             15 YIELD_VALUE
             16 LIST_APPEND              2
             19 JUMP_ABSOLUTE            6
        >>   22 RETURN_VALUE
>>> dis.dis(compile("((yield i) for i in range(3))", '', 'exec').co_consts[0])
  1           0 LOAD_FAST                0 (.0)
        >>    3 FOR_ITER                12 (to 18)
              6 STORE_FAST               1 (i)
              9 LOAD_FAST                1 (i)
             12 YIELD_VALUE
             13 YIELD_VALUE
             14 POP_TOP
             15 JUMP_ABSOLUTE            3
        >>   18 LOAD_CONST               0 (None)
             21 RETURN_VALUE

YIELD_VALUE字节码索引分别为15和12的操作码是多余的,是巢中的杜鹃。因此,对于list-comprehension-turned-generator,您每次生成1都会产生堆栈的顶部(使用yield返回值替换堆栈的顶部),而对于Generator表达式变体,您将产生1的堆栈顶部(整数),然后再次产生,但现在堆栈包含的返回值,yield您将获得None第二次。

对于列表理解,list仍然会返回预期的对象输出,但是Python 3将其视为生成器,因此将返回值附加为StopIteration异常作为value属性:

>>> from itertools import islice
>>> listgen = [(yield i) for i in range(3)]
>>> list(islice(listgen, 3))  # avoid exhausting the generator
[0, 1, 2]
>>> try:
...     next(listgen)
... except StopIteration as si:
...     print(si.value)
... 
[None, None, None]

这些None对象是yield表达式的返回值。

并再次重申这一点;同样的问题也适用于Python 2和Python 3中的字典和集合理解;在Python 2中,yield返回值仍添加到预期的字典或set对象中,并且返回值最后一次“屈服”而不是附加到StopIteration异常:

>>> list({(yield k): (yield v) for k, v in {'foo': 'bar', 'spam': 'eggs'}.items()})
['bar', 'foo', 'eggs', 'spam', {None: None}]
>>> list({(yield i) for i in range(3)})
[0, 1, 2, set([None])]

请注意,根据语言规范,yield-atom允许在表达式内部(生成器函数内部)。如果以yield-atom某种方式实施不当,这可能会更成问题。
2015年

1
@skyking:这就是我的意思;语法允许它。我所指的错误是尝试将ayield 作为生成器函数内部的生成器表达式的一部分使用,其中的期望是yield适用于生成器函数,而不是生成器表达式的嵌套范围。
马丁·彼得斯

哇。确实非常有用。因此,如果我正确理解,则会发生以下情况:一个包含了两者yieldreturn应记录的函数,将变成一个生成器函数,其returned值应位于StopIteration异常中,并且具有yield内部外观的列表理解的字节码(尽管它是就像这样的函数的字节码一样。
zabolekar

@zabolekar:类似的东西;步骤类似于:编译器遇到列表理解,因此构建了一个代码对象;编译器遇到一个yield表达式,因此将当前代码对象标记为生成器。瞧,我们有一个生成器函数。
马丁·彼得斯

1
@Chris_Rands 2.7更改适用于您使用-3兼容性警告时。
马丁·彼得斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.