10182

yield关键字在Python中的用途是什么？

例如，我试图理解这段代码¹：

def _get_child_candidates(self, distance, min_dist, max_dist):
    if self._leftchild and distance - max_dist < self._median:
        yield self._leftchild
    if self._rightchild and distance + max_dist >= self._median:
        yield self._rightchild

这是呼叫者：

result, candidates = [], [self]
while candidates:
    node = candidates.pop()
    distance = node._get_dist(obj)
    if distance <= max_dist and distance >= min_dist:
        result.extend(node._values)
    candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))
return result

_get_child_candidates调用该方法会怎样？是否返回列表？一个元素？再叫一次吗？后续通话何时停止？

_{1.这段代码是由Jochen Schulz（jrschulz）编写的，Jochen Schulz是一个很好的用于度量空间的Python库。这是完整源代码的链接：Module mspace。}

— 亚历克斯 S.
source

14636

要了解其yield作用，您必须了解什么是生成器。而且，在您了解生成器之前，您必须了解iterables。

可迭代

创建列表时，可以一一阅读它的项目。逐一读取其项称为迭代：

>>> mylist = [1, 2, 3]
>>> for i in mylist:
...    print(i)
1
2
3

mylist是一个可迭代的。当您使用列表推导时，您将创建一个列表，因此是可迭代的：

>>> mylist = [x*x for x in range(3)]
>>> for i in mylist:
...    print(i)
0
1
4

您可以使用的所有“ for... in...”都是可迭代的；lists，strings，文件...

这些可迭代的方法很方便，因为您可以随意读取它们，但是您将所有值都存储在内存中，当拥有很多值时，这并不总是想要的。

发电机

生成器是迭代器，一种迭代，您只能迭代一次。生成器不会将所有值存储在内存中，它们会即时生成值：

>>> mygenerator = (x*x for x in range(3))
>>> for i in mygenerator:
...    print(i)
0
1
4

只是您使用()代替一样[]。但是，由于生成器只能使用一次，因此您无法执行for i in mygenerator第二次：生成器计算0，然后忽略它，然后计算1，最后一次计算4，最后一次。

产量

yield是与一样使用的关键字return，不同之处在于该函数将返回生成器。

>>> def createGenerator():
...    mylist = range(3)
...    for i in mylist:
...        yield i*i
...
>>> mygenerator = createGenerator() # create a generator
>>> print(mygenerator) # mygenerator is an object!
<generator object createGenerator at 0xb7555c34>
>>> for i in mygenerator:
...     print(i)
0
1
4

这是一个无用的示例，但是当您知道函数将返回大量的值（只需要读取一次）时，它就很方便。

要掌握yield，您必须了解在调用函数时，在函数主体中编写的代码不会运行。该函数仅返回生成器对象，这有点棘手:-)

然后，您的代码将在每次for使用生成器时从中断处继续。

现在最困难的部分是：

第一次for调用从您的函数创建的生成器对象时，它将从头开始运行函数中的代码，直到命中为止yield，然后它将返回循环的第一个值。然后，每个后续调用将运行您在函数中编写的循环的另一个迭代，并返回下一个值。这将一直持续到生成器被认为是空的为止，这在函数运行时没有命中时就会发生yield。那可能是因为循环已经结束，或者是因为您不再满足"if/else"。

您的代码说明

发电机：

# Here you create the method of the node object that will return the generator
def _get_child_candidates(self, distance, min_dist, max_dist):

    # Here is the code that will be called each time you use the generator object:

    # If there is still a child of the node object on its left
    # AND if the distance is ok, return the next child
    if self._leftchild and distance - max_dist < self._median:
        yield self._leftchild

    # If there is still a child of the node object on its right
    # AND if the distance is ok, return the next child
    if self._rightchild and distance + max_dist >= self._median:
        yield self._rightchild

    # If the function arrives here, the generator will be considered empty
    # there is no more than two values: the left and the right children

呼叫者：

# Create an empty list and a list with the current object reference
result, candidates = list(), [self]

# Loop on candidates (they contain only one element at the beginning)
while candidates:

    # Get the last candidate and remove it from the list
    node = candidates.pop()

    # Get the distance between obj and the candidate
    distance = node._get_dist(obj)

    # If distance is ok, then you can fill the result
    if distance <= max_dist and distance >= min_dist:
        result.extend(node._values)

    # Add the children of the candidate in the candidate's list
    # so the loop will keep running until it will have looked
    # at all the children of the children of the children, etc. of the candidate
    candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))

return result

该代码包含几个智能部分：

循环在一个列表上迭代，但是循环在迭代时列表会扩展:-)这是浏览所有这些嵌套数据的一种简洁方法，即使这样做有点危险，因为您可能会遇到无限循环。在这种情况下，请candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))耗尽所有生成器的值，但是while继续创建新的生成器对象，因为它们未应用于同一节点，因此将产生与先前值不同的值。
该extend()方法是期望可迭代并将其值添加到列表的列表对象方法。

通常我们将一个列表传递给它：

>>> a = [1, 2]
>>> b = [3, 4]
>>> a.extend(b)
>>> print(a)
[1, 2, 3, 4]

但是在您的代码中，它得到了一个生成器，这很好，因为：

您无需两次读取值。
您可能有很多孩子，并且您不希望所有孩子都存储在内存中。

它之所以有效，是因为Python不在乎方法的参数是否为列表。Python期望可迭代，因此它将与字符串，列表，元组和生成器一起使用！这就是所谓的鸭子输入，这是Python如此酷的原因之一。但这是另一个故事，还有另一个问题...

您可以在这里停止，或者阅读一点以了解生成器的高级用法：

控制发电机耗尽

>>> class Bank(): # Let's create a bank, building ATMs
...    crisis = False
...    def create_atm(self):
...        while not self.crisis:
...            yield "$100"
>>> hsbc = Bank() # When everything's ok the ATM gives you as much as you want
>>> corner_street_atm = hsbc.create_atm()
>>> print(corner_street_atm.next())
$100
>>> print(corner_street_atm.next())
$100
>>> print([corner_street_atm.next() for cash in range(5)])
['$100', '$100', '$100', '$100', '$100']
>>> hsbc.crisis = True # Crisis is coming, no more money!
>>> print(corner_street_atm.next())
<type 'exceptions.StopIteration'>
>>> wall_street_atm = hsbc.create_atm() # It's even true for new ATMs
>>> print(wall_street_atm.next())
<type 'exceptions.StopIteration'>
>>> hsbc.crisis = False # The trouble is, even post-crisis the ATM remains empty
>>> print(corner_street_atm.next())
<type 'exceptions.StopIteration'>
>>> brand_new_atm = hsbc.create_atm() # Build a new one to get back in business
>>> for cash in brand_new_atm:
...    print cash
$100
$100
$100
$100
$100
$100
$100
$100
$100
...

注意：对于Python 3，请使用print(corner_street_atm.__next__())或print(next(corner_street_atm))

对于诸如控制对资源的访问之类的各种事情，它可能很有用。

Itertools，您最好的朋友

itertools模块包含用于操纵可迭代对象的特殊功能。曾经希望复制一个发电机吗？连锁两个发电机？用一个班轮对嵌套列表中的值进行分组？Map / Zip没有创建另一个列表？

然后就import itertools。

一个例子？让我们看一下四马比赛的可能到达顺序：

>>> horses = [1, 2, 3, 4]
>>> races = itertools.permutations(horses)
>>> print(races)
<itertools.permutations object at 0xb754f1dc>
>>> print(list(itertools.permutations(horses)))
[(1, 2, 3, 4),
 (1, 2, 4, 3),
 (1, 3, 2, 4),
 (1, 3, 4, 2),
 (1, 4, 2, 3),
 (1, 4, 3, 2),
 (2, 1, 3, 4),
 (2, 1, 4, 3),
 (2, 3, 1, 4),
 (2, 3, 4, 1),
 (2, 4, 1, 3),
 (2, 4, 3, 1),
 (3, 1, 2, 4),
 (3, 1, 4, 2),
 (3, 2, 1, 4),
 (3, 2, 4, 1),
 (3, 4, 1, 2),
 (3, 4, 2, 1),
 (4, 1, 2, 3),
 (4, 1, 3, 2),
 (4, 2, 1, 3),
 (4, 2, 3, 1),
 (4, 3, 1, 2),
 (4, 3, 2, 1)]

了解迭代的内部机制

迭代是一个隐含可迭代（实现__iter__()方法）和迭代器（实现__next__()方法）的过程。可迭代对象是可以从中获取迭代器的任何对象。迭代器是使您可以迭代的对象。

本文还提供了有关循环如何for工作的更多信息。

— 满足
source

353

yield这个答案并不神奇。当您yield在任何地方调用包含语句的函数时，都会得到一个生成器对象，但是没有代码运行。然后，每次您从生成器中提取一个对象时，Python都会在函数中执行代码，直到涉及到yield语句为止，然后暂停并交付该对象。当您提取另一个对象时，Python会在yield和之后继续执行，直到到达另一个对象为止yield（通常是相同的对象，但是要经过一个迭代）。这一直持续到该功能结束时为止，此时发电机被认为已耗尽。

— 马提亚斯·弗里普

28

“这些可迭代的方法很方便……但是您将所有值存储在内存中，而这并不总是您想要的”，这是错误的或令人困惑的。一个iterable在调用iter（）时会返回一个迭代器，并且迭代器并不一定总是将其值存储在内存中，这取决于iter方法的实现，它还可以按需按顺序生成值。

— Picmate涅夫

这将是很好添加到这个伟大的答案，为什么它仅仅是除所用的相同()的替代[]，具体是什么()是（有可能是一个元组混淆）。

— WoJ

我可能是错的，但是生成器不是迭代器，“称为生成器”是迭代器。

— 阿德霍克斯（Aderchox）

2006

理解的捷径 `yield`

当您看到带有yield语句的函数时，请应用以下简单技巧，以了解将发生的情况：

result = []在函数的开头插入一行。
替换每个yield expr有result.append(expr)。
return result在函数底部插入一行。
是的-不再yield声明！阅读并找出代码。
将功能与原始定义进行比较。

这个技巧可能会让您对函数背后的逻辑yield有所了解，但是实际发生的事情与基于列表的方法发生的事情明显不同。在许多情况下，yield方法也将具有更高的内存效率和更快的速度。在其他情况下，即使原始函数运行正常，此技巧也会使您陷入无限循环。请继续阅读以了解更多信息...

不要混淆您的Iterable，Iterators和Generators

首先，迭代器协议 -当您编写时

for x in mylist:
    ...loop body...

Python执行以下两个步骤：

获取一个迭代器 mylist：

调用iter(mylist)->这将返回一个带有next()方法（或__next__()在Python 3中）。

[这是大多数人忘记告诉您的步骤]
使用迭代器遍历项目：

继续next()在从步骤1返回的迭代器上调用该方法。从的返回值next()被分配给x并执行循环体。如果StopIteration从内部引发异常next()，则意味着迭代器中没有更多值，并且退出了循环。

事实是，Python在想要遍历对象内容的任何时候都执行上述两个步骤-因此它可以是for循环，但也可以是类似的代码otherlist.extend(mylist)（其中otherlist是Python列表）。

这mylist是一个可迭代的，因为它实现了迭代器协议。在用户定义的类中，可以实现该__iter__()方法以使您的类的实例可迭代。此方法应返回迭代器。迭代器是带有next()方法的对象。它可以同时实现__iter__()，并next()在同一类，并有__iter__()回报self。这适用于简单的情况，但是当您希望两个迭代器同时在同一个对象上循环时，则不能使用。

这就是迭代器协议，许多对象都实现了该协议：

内置列表，字典，元组，集合，文件。
实现的用户定义的类__iter__()。
发电机。

请注意，for循环不知道它要处理的是哪种对象-它仅遵循迭代器协议，并且很高兴在调用时逐项获取next()。内置列表一一返回它们的项，词典一一返回键，文件一一返回行，依此类推。生成器返回...就是这样yield：

def f123():
    yield 1
    yield 2
    yield 3

for item in f123():
    print item

yield如果没有三个return语句，f123()则只执行第一个语句，而不是语句，然后函数将退出。但是f123()没有普通的功能。当f123()被调用时，它不会返回yield语句中的任何值！它返回一个生成器对象。另外，该函数并没有真正退出-进入了挂起状态。当for循环尝试遍历生成器对象时，该函数从yield先前返回的下一行从其挂起状态恢复，执行下一行代码（在这种情况下为yield语句），并将其作为下一行返回项目。这会一直发生，直到函数退出，此时生成器将引发StopIteration，然后循环退出。

因此，生成器对象有点像适配器-在一端，它通过公开__iter__()和next()保持for循环满意的方法来展示迭代器协议。但是，在另一端，它仅运行该函数以从中获取下一个值，然后将其放回暂停模式。

为什么使用发电机？

通常，您可以编写不使用生成器但实现相同逻辑的代码。一种选择是使用我之前提到的临时列表“技巧”。这并非在所有情况下都可行，例如，如果您有无限循环，或者当您的列表很长时，这可能会导致内存使用效率低下。另一种方法是实现一个新的可迭代类SomethingIter，该类将状态保留在实例成员中，并在其next()（或__next__()Python 3）方法中执行下一个逻辑步骤。根据逻辑，next()方法中的代码可能最终看起来非常复杂并且容易出现错误。在这里，发电机提供了一种干净而简单的解决方案。

— 用户名
source

19

“当您看到带有yield语句的函数时，请应用此简单技巧，以了解将要发生的事情。”这难道不是完全忽略您可以send进入生成器这一事实，而这是生成器要点的重要部分吗？

— DanielSank

10

“这可能是一个for循环，但也可能是类似otherlist.extend(mylist)“->的代码。extend()就地修改列表，并且不返回可迭代对象。尝试循环otherlist.extend(mylist)将失败，TypeError因为extend()隐式返回None，并且您无法循环None。

— Pedro

4

@pedro您误解了这句话。这意味着python在执行时会在mylist（而非otherlist）上执行提到的两个步骤otherlist.extend(mylist)。

— 今天

555

这样想：

迭代器只是一个带有next()方法的对象的美化名词。因此，产生收益的函数最终是这样的：

原始版本：

def some_function():
    for i in xrange(4):
        yield i

for i in some_function():
    print i

这基本上是Python解释器使用上面的代码执行的操作：

class it:
    def __init__(self):
        # Start at -1 so that we get 0 when we add 1 below.
        self.count = -1

    # The __iter__ method will be called once by the 'for' loop.
    # The rest of the magic happens on the object returned by this method.
    # In this case it is the object itself.
    def __iter__(self):
        return self

    # The next method will be called repeatedly by the 'for' loop
    # until it raises StopIteration.
    def next(self):
        self.count += 1
        if self.count < 4:
            return self.count
        else:
            # A StopIteration exception is raised
            # to signal that the iterator is done.
            # This is caught implicitly by the 'for' loop.
            raise StopIteration

def some_func():
    return it()

for i in some_func():
    print i

为了更深入地了解幕后发生的事情，for可以将循环重写为：

iterator = some_func()
try:
    while 1:
        print iterator.next()
except StopIteration:
    pass

这是否更有意义，还是会让您更加困惑？:)

我要指出，这是为了说明的目的过于简单化。:)

— 杰森·贝克（Jason Baker）
source

1

__getitem__可以代替定义__iter__。例如：class it: pass; it.__getitem__ = lambda self, i: i*10 if i < 10 else [][0]; for i in it(): print(i)，它将打印：

— 0、10、20

16

我在Python 3.6中尝试了这个示例，如果我创建iterator = some_function()，则变量iterator不再具有调用的函数next()，而只有一个__next__()函数。以为我会提到它。

— 彼得

for您编写的循环实现在哪里调用__iter__方法iterator的实例化实例it？

— SystematicDisintegration

455

该yield关键字被减少到两个简单的事实：

如果编译器在函数内部的任何位置检测到yield关键字，则该函数不再通过该语句返回。相反，它立即返回一个懒惰的“待处理列表”对象，称为生成器return
生成器是可迭代的。什么是可迭代的？就像是listor或setor range或dict-view一样，它带有用于以特定顺序访问每个元素的内置协议。

简而言之：生成器是一个懒惰的，增量待定的list，并且yield语句允许您使用函数符号来编程生成器应逐渐吐出的列表值。

generator = myYieldingFunction(...)
x = list(generator)

   generator
       v
[x[0], ..., ???]

         generator
             v
[x[0], x[1], ..., ???]

               generator
                   v
[x[0], x[1], x[2], ..., ???]

                       StopIteration exception
[x[0], x[1], x[2]]     done

list==[x[0], x[1], x[2]]

例

让我们定义一个makeRange类似于Python的函数range。调用makeRange(n)“返回生成器”：

def makeRange(n):
    # return 0,1,2,...,n-1
    i = 0
    while i < n:
        yield i
        i += 1

>>> makeRange(5)
<generator object makeRange at 0x19e4aa0>

要强制生成器立即返回其待处理的值，可以将其传递给list()（就像您可以进行任何迭代一样）：

>>> list(makeRange(5))
[0, 1, 2, 3, 4]

将示例与“仅返回列表”进行比较

可以将上面的示例视为仅创建一个列表，并将其附加并返回：

# list-version                   #  # generator-version
def makeRange(n):                #  def makeRange(n):
    """return [0,1,2,...,n-1]""" #~     """return 0,1,2,...,n-1"""
    TO_RETURN = []               #>
    i = 0                        #      i = 0
    while i < n:                 #      while i < n:
        TO_RETURN += [i]         #~         yield i
        i += 1                   #          i += 1  ## indented
    return TO_RETURN             #>

>>> makeRange(5)
[0, 1, 2, 3, 4]

但是，有一个主要区别。请参阅最后一节。

您如何使用发电机

可迭代是列表理解的最后一部分，并且所有生成器都是可迭代的，因此经常像这样使用它们：

#                   _ITERABLE_
>>> [x+10 for x in makeRange(5)]
[10, 11, 12, 13, 14]

为了使发电机更好地使用，您可以使用该itertools模块（一定要使用chain.from_iterable而不是chain在保修期内）。例如，您甚至可以使用生成器来实现无限长的惰性列表，例如itertools.count()。您可以实现自己的def enumerate(iterable): zip(count(), iterable)，也可以yield在while循环中使用关键字来实现。

请注意：生成器实际上可以用于更多事情，例如实现协程或不确定性编程或其他优雅的事情。但是，我在这里提出的“惰性列表”观点是您会发现的最常见用法。

幕后花絮

这就是“ Python迭代协议”的工作方式。就是说，当你做什么的时候list(makeRange(5))。这就是我之前所说的“懒惰的增量列表”。

>>> x=iter(range(5))
>>> next(x)
0
>>> next(x)
1
>>> next(x)
2
>>> next(x)
3
>>> next(x)
4
>>> next(x)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

内置函数next()仅调用对象.next()函数，它是“迭代协议”的一部分，可以在所有迭代器上找到。您可以手动使用next()函数（以及迭代协议的其他部分）来实现奇特的事情，通常是以牺牲可读性为代价的，因此请避免这样做。

细节

通常，大多数人不会关心以下区别，并且可能想在这里停止阅读。

用Python来说，可迭代对象是“了解for循环的概念”的任何对象，例如列表[1,2,3]，而迭代器是所请求的for循环的特定实例，例如[1,2,3].__iter__()。一个发电机是完全一样的任何迭代器，除了它是写（带有功能语法）的方式。

当您从列表中请求迭代器时，它将创建一个新的迭代器。但是，当您从迭代器请求迭代器时（很少这样做），它只会为您提供自身的副本。

因此，在极少数情况下，您可能无法执行此类操作...

> x = myRange(5)
> list(x)
[0, 1, 2, 3, 4]
> list(x)
[]

...然后记住生成器是迭代器 ; 即是一次性使用。如果要重用它，则应myRange(...)再次调用。如果需要两次使用结果，请将结果转换为列表并将其存储在变量中x = list(myRange(5))。那些绝对需要克隆生成器的人（例如，正在可怕地修改程序的人）可以itertools.tee在绝对必要的情况下使用，因为可复制的迭代器Python PEP标准建议已被推迟。

— 忍者壁虎
source

377

什么是yield关键词在Python呢？

答案大纲/摘要

具有的函数yield在被调用时将返回Generator。
生成器是迭代器，因为它们实现了迭代器协议，因此您可以对其进行迭代。
也可以向生成器发送信息，使其在概念上成为协程。
在Python 3中，您可以使用双向将一个生成器委托给另一个生成器yield from。
（附录对几个答案进行了评论，包括最上面的一个，并讨论了return在生成器中的用法。）

发电机：

yield仅在函数定义内部合法，并且在函数定义中包含yield使其返回生成器。

生成器的想法来自具有不同实现方式的其他语言（请参见脚注1）。在Python的Generators中，代码的执行会在收益率点冻结。调用生成器时（下面将讨论方法），恢复执行，然后冻结下一个产量。

yield提供了一种实现迭代器协议的简便方法，该协议由以下两种方法定义： __iter__和next（Python 2）或__next__（Python 3）。这两种方法都使对象成为迭代器，您可以使用模块中的IteratorAbstract Base Class对其进行类型检查collections。

>>> def func():
...     yield 'I am'
...     yield 'a generator!'
... 
>>> type(func)                 # A function with yield is still a function
<type 'function'>
>>> gen = func()
>>> type(gen)                  # but it returns a generator
<type 'generator'>
>>> hasattr(gen, '__iter__')   # that's an iterable
True
>>> hasattr(gen, 'next')       # and with .next (.__next__ in Python 3)
True                           # implements the iterator protocol.

生成器类型是迭代器的子类型：

>>> import collections, types
>>> issubclass(types.GeneratorType, collections.Iterator)
True

并且如有必要，我们可以像这样进行类型检查：

>>> isinstance(gen, types.GeneratorType)
True
>>> isinstance(gen, collections.Iterator)
True

的一个功能Iterator 是，一旦用尽，您将无法重复使用或重置它：

>>> list(gen)
['I am', 'a generator!']
>>> list(gen)
[]

如果要再次使用其功能，则必须另做一个（请参见脚注2）：

>>> list(func())
['I am', 'a generator!']

一个人可以通过编程方式产生数据，例如：

def func(an_iterable):
    for item in an_iterable:
        yield item

上面的简单生成器也等效于下面的生成器-从Python 3.3开始（在Python 2中不可用），您可以使用yield from：

def func(an_iterable):
    yield from an_iterable

但是，yield from还允许委派给子生成器，这将在以下有关使用子协程进行合作委派的部分中进行解释。

协程：

yield 形成一个表达式，该表达式允许将数据发送到生成器中（请参见脚注3）

这是一个示例，请注意该received变量，该变量将指向发送到生成器的数据：

def bank_account(deposited, interest_rate):
    while True:
        calculated_interest = interest_rate * deposited 
        received = yield calculated_interest
        if received:
            deposited += received


>>> my_account = bank_account(1000, .05)

首先，我们必须使内置函数生成器排队next。它将调用适当的next或__next__方法，具体取决于您所使用的Python版本：

>>> first_year_interest = next(my_account)
>>> first_year_interest
50.0

现在我们可以将数据发送到生成器中。（发送None与呼叫相同next。）：

>>> next_year_interest = my_account.send(first_year_interest + 1000)
>>> next_year_interest
102.5

合作协办小组 `yield from`

现在，回想一下yield fromPython 3中可用的功能。这使我们可以将协程委托给子协程：

def money_manager(expected_rate):
    under_management = yield     # must receive deposited value
    while True:
        try:
            additional_investment = yield expected_rate * under_management 
            if additional_investment:
                under_management += additional_investment
        except GeneratorExit:
            '''TODO: write function to send unclaimed funds to state'''
        finally:
            '''TODO: write function to mail tax info to client'''


def investment_account(deposited, manager):
    '''very simple model of an investment account that delegates to a manager'''
    next(manager) # must queue up manager
    manager.send(deposited)
    while True:
        try:
            yield from manager
        except GeneratorExit:
            return manager.close()

现在我们可以将功能委派给子生成器，并且生成器可以像上面一样使用它：

>>> my_manager = money_manager(.06)
>>> my_account = investment_account(1000, my_manager)
>>> first_year_return = next(my_account)
>>> first_year_return
60.0
>>> next_year_return = my_account.send(first_year_return + 1000)
>>> next_year_return
123.6

你可以阅读更多的精确语义yield from在PEP 380。

其他方法：关闭并抛出

该close方法GeneratorExit在函数执行被冻结的时候引发。这也将由调用，__del__因此您可以将任何清理代码放在处理位置GeneratorExit：

>>> my_account.close()

您还可以引发异常，该异常可以在生成器中处理或传播回用户：

>>> import sys
>>> try:
...     raise ValueError
... except:
...     my_manager.throw(*sys.exc_info())
... 
Traceback (most recent call last):
  File "<stdin>", line 4, in <module>
  File "<stdin>", line 2, in <module>
ValueError

结论

我相信我已经涵盖了以下问题的各个方面：

什么是yield关键词在Python呢？

事实证明，这样yield做确实很有帮助。我相信我可以为此添加更详尽的示例。如果您想要更多或有建设性的批评，请在下面评论中告诉我。

附录：

对最佳/可接受答案的评论**

仅以列表为例，它对使可迭代的内容感到困惑。请参阅上面的参考资料，但总而言之：iterable具有__iter__返回iterator的方法。一个迭代器提供了一个.next（Python 2里或.__next__（Python 3的）方法，它是隐式由称为for循环，直到它提出StopIteration，并且一旦这样做，将继续这样做。
然后，它使用生成器表达式来描述什么是生成器。由于生成器只是创建迭代器的一种简便方法，因此它只会使事情变得混乱，而我们仍然没有涉及到这一yield部分。
在控制发电机的排气中，他调用了.next方法，而应该使用内置函数next。这将是一个适当的间接层，因为他的代码在Python 3中不起作用。
Itertools？这根本与做什么无关yield。
没有讨论yield与yield fromPython 3中的新功能一起提供的方法。最高/可接受的答案是非常不完整的答案。

对`yield`生成器表达或理解中提出的答案的评论。

该语法当前允许列表理解中的任何表达式。

expr_stmt: testlist_star_expr (annassign | augassign (yield_expr|testlist) |
                     ('=' (yield_expr|testlist_star_expr))*)
...
yield_expr: 'yield' [yield_arg]
yield_arg: 'from' test | testlist

由于yield是一种表达，因此尽管没有特别好的用例，但有人认为它可以用于理解或生成器表达中。

CPython核心开发人员正在讨论弃用其津贴。这是邮件列表中的相关帖子：

2017年1月30日19:05，布雷特·坎农写道：

2017年1月29日星期日，克雷格·罗德里格斯（Craig Rodrigues）在星期日写道：

两种方法我都可以。恕我直言，把事情留在Python 3中是不好的。

我的投票是SyntaxError，因为您没有从语法中得到期望。

我同意这对我们来说是一个明智的选择，因为依赖当前行为的任何代码确实太聪明了，无法维护。

在到达目的地方面，我们可能需要：

3.7中的语法警告或弃用警告

2.7.x中的Py3k警告

3.8中的SyntaxError

干杯，尼克。

-Nick Coghlan | gmail.com上的ncoghlan | 澳大利亚布里斯班

此外，还有一个悬而未决的问题（10544），似乎正说明这绝不是一个好主意（PyPy，用Python编写的Python实现，已经在发出语法警告。）

最重要的是，直到CPython的开发人员另行告诉我们为止：不要放入yield生成器表达式或理解。

`return`生成器中的语句

在Python 2中：

在生成器函数中，该return语句不允许包含expression_list。在这种情况下，裸露return表示生成器已完成并且将引起StopIteration提升。

An expression_list基本上是由逗号分隔的任意数量的表达式-本质上，在Python 2中，您可以使用停止生成器return，但不能返回值。

在Python 3中：

在生成器函数中，该return语句指示生成器完成并且将引起StopIteration提升。返回的值（如果有）用作构造的参数，StopIteration并成为StopIteration.value属性。

脚注

_{提案中引用了CLU，Sather和Icon语言，以将生成器的概念引入Python。总体思路是，一个函数可以维护内部状态并根据用户的需要产生中间数据点。这有望在性能上优于其他方法，包括Python线程，该方法甚至在某些系统上不可用。}
_{例如，这意味着xrange对象（range在Python 3中）不是Iterator，即使它们是可迭代的，因为它们可以被重用。像列表一样，它们的__iter__方法返回迭代器对象。}
_{yield最初是作为语句引入的，这意味着它只能出现在代码块的一行的开头。现在yield创建一个yield表达式。
https://docs.python.org/2/reference/simple_stmts.html#grammar-token-yield_stmt 提出
此更改是为了允许用户将数据发送到生成器中，就像接收数据一样。要发送数据，必须能够将其分配给某物，为此，一条语句就行不通了。}

— 亚伦·霍尔
source

328

yield就像return-它返回您告诉的内容（作为生成器）。不同之处在于，下一次您调用生成器时，执行将从上一次对yield语句的调用开始。与return不同的是，在产生良率时不会清除堆栈帧，但是会将控制权转移回调用方，因此下次调用该函数时，其状态将恢复。

就您的代码而言，该函数get_child_candidates的作用就像一个迭代器，以便在扩展列表时，它一次将一个元素添加到新列表中。

list.extend调用迭代器，直到耗尽为止。在您发布的代码示例的情况下，只返回一个元组并将其添加到列表中会更加清楚。

— 道格拉斯·梅尔
source

107

这很接近，但不正确。每次调用其中带有yield语句的函数时，它都会返回一个全新的生成器对象。只有当您调用该生成器的.next（）方法时，执行才会在最后一次屈服之后恢复。

— kurosch

239

还有另外一件事要提及：yield的函数实际上不必终止。我写了这样的代码：

def fib():
    last, cur = 0, 1
    while True: 
        yield cur
        last, cur = cur, last + cur

然后我可以在其他代码中使用它：

for f in fib():
    if some_condition: break
    coolfuncs(f);

它确实有助于简化某些问题，并使某些事情更易于使用。

— 克劳迪乌
source

233

对于那些偏爱简单示例的人，请在此交互式Python会话中进行冥想：

>>> def f():
...   yield 1
...   yield 2
...   yield 3
... 
>>> g = f()
>>> for i in g:
...   print(i)
... 
1
2
3
>>> for i in g:
...   print(i)
... 
>>> # Note that this time nothing was printed

— 丹尼尔
source

208

TL; DR

代替这个：

def square_list(n):
    the_list = []                         # Replace
    for x in range(n):
        y = x * x
        the_list.append(y)                # these
    return the_list                       # lines

做这个：

def square_yield(n):
    for x in range(n):
        y = x * x
        yield y                           # with this one.

每当您发现自己从头开始建立清单时，就yield逐一列出。

这是我第一次屈服。

yield是一种含蓄的说法

建立一系列的东西

相同的行为：

>>> for square in square_list(4):
...     print(square)
...
0
1
4
9
>>> for square in square_yield(4):
...     print(square)
...
0
1
4
9

不同的行为：

收益是单次通过：您只能迭代一次。当一个函数包含一个yield时，我们称其为Generator函数。还有一个迭代器就是它返回的内容。这些术语在揭示。我们失去了容器的便利性，但获得了按需计算且任意长的序列的功效。

产量懒惰，推迟了计算。当您调用函数时，其中包含yield的函数实际上根本不会执行。它返回一个迭代器对象，该对象记住它从何处中断。每次您调用next()迭代器（这在for循环中发生）时，执行都会向前推进到下一个收益。return引发StopIteration并结束序列（这是for循环的自然结束）。

产量多才多艺。数据不必全部存储在一起，可以一次存储一次。它可以是无限的。

>>> def squares_all_of_them():
...     x = 0
...     while True:
...         yield x * x
...         x += 1
...
>>> squares = squares_all_of_them()
>>> for _ in range(4):
...     print(next(squares))
...
0
1
4
9

如果您需要多次通过，而系列又不太长，只需调用list()它：

>>> list(square_yield(4))
[0, 1, 4, 9]

单词的出色选择，yield因为两种含义都适用：

产量 —生产或提供（如在农业中）

...提供系列中的下一个数据。

屈服 —让步或放弃（如在政治权力中一样）

...放弃CPU执行，直到迭代器前进。

— 鲍勃·斯坦
source

194

产量可以为您提供发电机。

def get_odd_numbers(i):
    return range(1, i, 2)
def yield_odd_numbers(i):
    for x in range(1, i, 2):
       yield x
foo = get_odd_numbers(10)
bar = yield_odd_numbers(10)
foo
[1, 3, 5, 7, 9]
bar
<generator object yield_odd_numbers at 0x1029c6f50>
bar.next()
1
bar.next()
3
bar.next()
5

如您所见，在第一种情况下，foo将整个列表立即保存在内存中。对于包含5个元素的列表来说，这不是什么大问题，但是如果您想要500万个列表，该怎么办？这不仅是一个巨大的内存消耗者，而且在调用该函数时还花费大量时间来构建。

在第二种情况下，bar只需为您提供一个生成器。生成器是可迭代的-这意味着您可以在for循环等中使用它，但是每个值只能被访问一次。所有的值也不会同时存储在存储器中。生成器对象“记住”您上次调用它时在循环中的位置-这样，如果您使用的是一个迭代的（例如）计数为500亿，则不必计数为500亿立即存储500亿个数字以进行计算。

再次，这是一个非常人为的示例，如果您真的想计数到500亿，则可能会使用itertools。:)

这是生成器最简单的用例。如您所说，它可以用来编写有效的排列，使用yield可以将内容推入调用堆栈，而不是使用某种堆栈变量。生成器还可以用于特殊的树遍历以及所有其他方式。

— 兰萨尔
source

只是一个注释-在Python 3中，它range还会返回一个生成器而不是一个列表，因此，在这种情况下，除了__repr__/ __str__被覆盖以显示更好的结果外，您还会看到类似的想法range(1, 10, 2)。

— 不是。

189

它正在返回发电机。我对Python并不是特别熟悉，但是如果您熟悉C＃的迭代器块，我相信它与C＃的迭代器块一样。

关键思想是，编译器/解释器/无论做什么都做一些技巧，以便就调用者而言，他们可以继续调用next（），并且将继续返回值- 就像Generator方法已暂停一样。现在显然您不能真正地“暂停”方法，因此编译器构建了一个状态机，供您记住您当前所在的位置以及局部变量等的外观。这比自己编写迭代器要容易得多。

— 乔恩·斯基特
source

167

在描述如何使用生成器的许多很棒的答案中，我还没有给出一种答案。这是编程语言理论的答案：

yieldPython中的语句返回一个生成器。Python中的生成器是一个返回延续的函数（特别是协程类型，但是延续代表了一种更通用的机制来了解正在发生的事情）。

编程语言理论中的连续性是一种更为基础的计算，但是由于它们很难推理而且也很难实现，因此并不经常使用。但是，关于延续是什么的想法很简单：只是尚未完成的计算状态。在此状态下，将保存变量的当前值，尚未执行的操作等。然后，在稍后的某个时刻，可以在程序中调用继续，以便将程序的变量重置为该状态，并执行保存的操作。

以这种更一般的形式进行的延续可以两种方式实现。在call/cc方式，程序的堆栈字面上保存，然后调用延续时，堆栈恢复。

在延续传递样式（CPS）中，延续只是普通的函数（仅在函数是第一类的语言中），程序员明确地对其进行管理并传递给子例程。以这种方式，程序状态由闭包（以及恰好在其中编码的变量）表示，而不是驻留在堆栈中某个位置的变量。管理控制流的函数接受连续作为参数（在CPS的某些变体中，函数可以接受多个连续），并通过简单地调用它们并随后返回来调用它们来操纵控制流。延续传递样式的一个非常简单的示例如下：

def save_file(filename):
  def write_file_continuation():
    write_stuff_to_file(filename)

  check_if_file_exists_and_user_wants_to_overwrite(write_file_continuation)

在这个（非常简单的）示例中，程序员保存了将文件实际写入连续的操作（该操作可能是非常复杂的操作，需要写出许多细节），然后传递该连续（例如，首先类闭包）给另一个进行更多处理的运算符，然后在必要时调用它。（我在实际的GUI编程中经常使用这种设计模式，这是因为它节省了我的代码行，或更重要的是，在GUI事件触发后管理了控制流。）

在不失一般性的前提下，本文的其余部分将连续性概念化为CPS，因为它很容易理解和阅读。

现在让我们谈谈Python中的生成器。生成器是延续的特定子类型。而延续能够在一般的保存状态计算（即程序调用堆栈），发电机只能保存迭代的状态经过一个迭代器。虽然，对于发电机的某些用例，此定义有些误导。例如：

def f():
  while True:
    yield 4

显然，这是一个合理的迭代器，其行为已得到很好的定义-每次生成器对其进行迭代时，它都会返回4（并永远这样做）。但是，在考虑迭代器（即for x in collection: do_something(x)）时，可能并没有想到可迭代的原型类型。此示例说明了生成器的功能：如果有什么是迭代器，生成器可以保存其迭代状态。

重申一下：连续可以保存程序堆栈的状态，而生成器可以保存迭代的状态。这意味着延续比生成器强大得多，但是生成器也非常简单。它们对于语言设计者来说更容易实现，对程序员来说也更容易使用（如果您有时间要燃烧，请尝试阅读并理解有关延续和call / cc的本页）。

但是您可以轻松地将生成器实现（并概念化）为连续传递样式的一种简单的特定情况：

每当yield调用时，它告诉函数返回一个延续。再次调用该函数时，将从中断处开始。因此，在伪伪代码（即不是伪代码，而不是代码）中，生成器的next方法基本上如下：

class Generator():
  def __init__(self,iterable,generatorfun):
    self.next_continuation = lambda:generatorfun(iterable)

  def next(self):
    value, next_continuation = self.next_continuation()
    self.next_continuation = next_continuation
    return value

其中，yield关键字实际上是真正的发电机功能语法糖，基本上是这样的：

def generatorfun(iterable):
  if len(iterable) == 0:
    raise StopIteration
  else:
    return (iterable[0], lambda:generatorfun(iterable[1:]))

请记住，这只是伪代码，Python中生成器的实际实现更为复杂。但是，作为练习以了解发生了什么，请尝试使用连续传递样式来实现生成器对象，而不使用yield关键字。

— 甲氨蝶呤
source

152

这是简单语言的示例。我将提供高级人类概念与低级Python概念之间的对应关系。

我想对数字序列进行运算，但是我不想为创建该序列而烦恼自己，我只想着重于自己想做的运算。因此，我执行以下操作：

我打电话给你，告诉你我想要一个以特定方式产生的数字序列，让您知道算法是什么。
此步骤对应于def生成器函数，即包含a的函数yield。
稍后，我告诉您，“好，准备告诉我数字的顺序”。
此步骤对应于调用生成器函数，该函数返回生成器对象。请注意，您还没有告诉我任何数字。你只要拿起纸和铅笔。
我问你，“告诉我下一个号码”，然后你告诉我第一个号码；之后，您等我问您下一个电话号码。记住您的位置，已经说过的电话号码以及下一个电话号码是您的工作。我不在乎细节。
此步骤对应于调用.next()生成器对象。
…重复上一步，直到…
最终，您可能会走到尽头。你不告诉我电话号码；您只是大声喊道：“抱马！我做完了！没有数字了！”
此步骤对应于生成器对象结束其工作并引发StopIteration异常。生成器函数不需要引发异常。函数结束或发出时，它将自动引发return。

这就是生成器的功能（包含的函数yield）；它开始执行，在执行时暂停yield，并在要求输入.next()值时从上一个点继续执行。根据设计，它与Python的迭代器协议完美契合，该协议描述了如何顺序请求值。

迭代器协议最著名的用户是forPython中的命令。因此，无论何时执行以下操作：

for item in sequence:

不管sequence是列表，字符串，字典还是如上所述的生成器对象，都没有关系；结果是相同的：您从一个序列中逐个读取项目。

注意，def包含一个yield关键字的函数并不是创建生成器的唯一方法；这是创建一个的最简单的方法。

有关更准确的信息，请阅读Python文档中有关迭代器类型，yield语句和生成器的信息。

— 佐特
source

130

尽管有许多答案说明了为什么要使用a yield来生成生成器，但是的使用更多了yield。创建协程非常容易，这使信息可以在两个代码块之间传递。我不会重复任何有关使用yield生成器的优秀示例。

为了帮助理解yield以下代码中的功能，您可以用手指在带有的任何代码中跟踪循环yield。每次手指触摸时yield，您都必须等待输入a next或a send。当next被调用时，您通过跟踪代码，直到你打yield...上的右边的代码yield进行评估，并返回给调用者...那你就等着。当next再次被调用时，您将在代码中执行另一个循环。但是，您会注意到，在协程中，yield也可以与send… 一起使用，它将从调用方将值发送到 yielding函数。如果send给出a，则yield接收到发送的值，然后将其吐到左侧...然后遍历代码，直到您yield再次单击为止（返回值，就像next被调用一样）。

例如：

>>> def coroutine():
...     i = -1
...     while True:
...         i += 1
...         val = (yield i)
...         print("Received %s" % val)
...
>>> sequence = coroutine()
>>> sequence.next()
0
>>> sequence.next()
Received None
1
>>> sequence.send('hello')
Received hello
2
>>> sequence.close()

— 迈克·麦克肯斯
source

可爱！一个蹦床（在Lisp的意义上）。很少有人看到这些！

— 00prometheus

129

还有另一个yield用途和含义（自Python 3.3起）：

yield from <expr>

从PEP 380-委托给子生成器的语法：

提出了一种语法，供生成器将其部分操作委托给另一生成器。这允许包含“ yield”的一段代码被分解出来并放置在另一个生成器中。此外，允许子生成器返回一个值，并且该值可用于委派生成器。

当一个生成器重新产生由另一个生成器生成的值时，新语法还为优化提供了一些机会。

此外，这将引入（自Python 3.5起）：

async def new_coroutine(data):
   ...
   await blocking_action()

为了避免将协程与常规生成器混淆（今天yield在两者中都使用）。

— 斯瓦沃米尔·莱纳特
source

117

所有好的答案，但是对于新手来说有点困难。

我认为您已经了解了该return声明。

作为一个比喻，return和yield是一对双胞胎。return表示“返回并停止”，而“收益”则表示“返回但继续”

尝试使用获取num_list return。

def num_list(n):
    for i in range(n):
        return i

运行：

In [5]: num_list(3)
Out[5]: 0

看，您只会得到一个数字，而不是列表。return永远不要让你高高兴兴，只实现一次就退出。

来了 yield

替换return为yield：

In [10]: def num_list(n):
    ...:     for i in range(n):
    ...:         yield i
    ...:

In [11]: num_list(3)
Out[11]: <generator object num_list at 0x10327c990>

In [12]: list(num_list(3))
Out[12]: [0, 1, 2]

现在，您将赢得所有数字。

与计划return一次运行和停止yield运行的时间进行比较。你可以理解return为return one of them，和yield作为return all of them。这称为iterable。

我们可以yield使用以下步骤重写语句return

In [15]: def num_list(n):
    ...:     result = []
    ...:     for i in range(n):
    ...:         result.append(i)
    ...:     return result

In [16]: num_list(3)
Out[16]: [0, 1, 2]

这是关于 yield。

列表return输出和对象之间的区别yield输出是：

您将始终从列表对象获取[0，1，2]，但只能从“对象yield输出”中检索一次。因此，它具有一个新的名称generator对象，如Out[11]: <generator object num_list at 0x10327c990>。

总之，作为一个隐喻，它可以：

return并且yield是双胞胎
list并且generator是双胞胎

— 结石
source

这是可以理解的，但是一个主要的区别是您可以在一个函数/方法中拥有多个收益。在这一点上，类比完全崩溃了。Yield会记住它在函数中的位置，因此，下次调用next（）时，函数将继续执行next yield。我认为这很重要，应该表达出来。

— 迈克S

104

以下是一些Python示例，这些示例说明如何实际实现生成器，就像Python没有为其提供语法糖一样：

作为Python生成器：

from itertools import islice

def fib_gen():
    a, b = 1, 1
    while True:
        yield a
        a, b = b, a + b

assert [1, 1, 2, 3, 5] == list(islice(fib_gen(), 5))

使用词法闭包而不是生成器

def ftake(fnext, last):
    return [fnext() for _ in xrange(last)]

def fib_gen2():
    #funky scope due to python2.x workaround
    #for python 3.x use nonlocal
    def _():
        _.a, _.b = _.b, _.a + _.b
        return _.a
    _.a, _.b = 0, 1
    return _

assert [1,1,2,3,5] == ftake(fib_gen2(), 5)

使用对象闭包而不是生成器（因为ClosuresAndObjectsAreEquivalent）

class fib_gen3:
    def __init__(self):
        self.a, self.b = 1, 1

    def __call__(self):
        r = self.a
        self.a, self.b = self.b, self.a + self.b
        return r

assert [1,1,2,3,5] == ftake(fib_gen3(), 5)

— 达斯汀·盖兹（Dustin Getz）
source

97

我打算发布“阅读Beazley的“ Python：基本参考”的第19页，以快速了解生成器”，但是已经有许多其他人发布了不错的描述。

另外，请注意，它们yield可以在协程中用作生成函数的双重功能。尽管它与您的代码段用法不同，(yield)但是可以用作函数中的表达式。当调用者使用该send()方法向该方法发送值时，协程将执行直到(yield)遇到下一条语句。

生成器和协程是设置数据流类型应用程序的一种很酷的方法。我认为有必要了解该yield语句在函数中的其他用法。

— 约翰扎卡里
source

97

从编程的角度来看，迭代器被实现为thunk。

为了将迭代器，生成器和线程池实现为并发执行等，作为重击（也称为匿名函数），人们使用发送到具有分派器的闭包对象的消息，然后分派器对“消息”做出响应。

http://en.wikipedia.org/wiki/Message_passing

“ next ”是发送给闭包的消息，由“ iter ”创建 ”调用。

有很多方法可以实现此计算。我使用了变异，但是通过返回当前值和下一个生成器，很容易做到无变异。

这是一个使用R6RS结构的演示，但是其语义与Python完全相同。它是相同的计算模型，只需要更改语法就可以用Python重写它。

Welcome to Racket v6.5.0.3.

-> (define gen
     (lambda (l)
       (define yield
         (lambda ()
           (if (null? l)
               'END
               (let ((v (car l)))
                 (set! l (cdr l))
                 v))))
       (lambda(m)
         (case m
           ('yield (yield))
           ('init  (lambda (data)
                     (set! l data)
                     'OK))))))
-> (define stream (gen '(1 2 3)))
-> (stream 'yield)
1
-> (stream 'yield)
2
-> (stream 'yield)
3
-> (stream 'yield)
'END
-> ((stream 'init) '(a b))
'OK
-> (stream 'yield)
'a
-> (stream 'yield)
'b
-> (stream 'yield)
'END
-> (stream 'yield)
'END
->

— 阿林索尔
source

84

这是一个简单的示例：

def isPrimeNumber(n):
    print "isPrimeNumber({}) call".format(n)
    if n==1:
        return False
    for x in range(2,n):
        if n % x == 0:
            return False
    return True

def primes (n=1):
    while(True):
        print "loop step ---------------- {}".format(n)
        if isPrimeNumber(n): yield n
        n += 1

for n in primes():
    if n> 10:break
    print "wiriting result {}".format(n)

输出：

loop step ---------------- 1
isPrimeNumber(1) call
loop step ---------------- 2
isPrimeNumber(2) call
loop step ---------------- 3
isPrimeNumber(3) call
wiriting result 3
loop step ---------------- 4
isPrimeNumber(4) call
loop step ---------------- 5
isPrimeNumber(5) call
wiriting result 5
loop step ---------------- 6
isPrimeNumber(6) call
loop step ---------------- 7
isPrimeNumber(7) call
wiriting result 7
loop step ---------------- 8
isPrimeNumber(8) call
loop step ---------------- 9
isPrimeNumber(9) call
loop step ---------------- 10
isPrimeNumber(10) call
loop step ---------------- 11
isPrimeNumber(11) call

我不是Python开发人员，但在我看来 yield保持着程序流程的位置，并且下一个循环从“ yield”位置开始。似乎它正在那个位置等待，就在那之前，在外面返回一个值，下一次继续工作。

这似乎是一种有趣而又不错的能力：D

— Engin OZTURK
source

你是对的。但是，看到“屈服”行为对流动有什么影响？我可以以数学的名义更改算法。有助于对“收益率”进行不同的评估吗？

— Engin OZTURK '18年

68

这是做什么事情的心理yield印象。

我喜欢将线程视为具有堆栈（即使未以这种方式实现）。

调用普通函数时，它将其局部变量放在堆栈上，进行一些计算，然后清除堆栈并返回。再也看不到其局部变量的值。

对于一个yield函数，当其代码开始运行时（即，在调用该函数之后，返回生成器对象，next()然后调用该方法的生成器对象），它类似地将其局部变量放入堆栈中并进行一段时间的计算。但是，当它命中该yield语句时，在清除堆栈的一部分并返回之前，它会对其局部变量进行快照，并将其存储在生成器对象中。它还在代码中写下了当前位置（即特定的yield语句）。

因此，这是生成器挂起的一种冻结函数。

当next()随后被调用时，它检索功能的物品入堆栈，重新蓬勃生机。该函数从中断处继续进行计算，而忽略了它刚刚在冷库中度过了一个永恒的事实。

比较以下示例：

def normalFunction():
    return
    if False:
        pass

def yielderFunction():
    return
    if False:
        yield 12

当我们调用第二个函数时，它的行为与第一个函数非常不同。该yield语句可能无法到达，但是如果它存在于任何地方，它将改变我们正在处理的内容的性质。

>>> yielderFunction()
<generator object yielderFunction at 0x07742D28>

调用yielderFunction()不会运行其代码，而是使代码生成器。（yielder为便于阅读，以这样的名称命名可能是个好主意。）

>>> gen = yielderFunction()
>>> dir(gen)
['__class__',
 ...
 '__iter__',    #Returns gen itself, to make it work uniformly with containers
 ...            #when given to a for loop. (Containers return an iterator instead.)
 'close',
 'gi_code',
 'gi_frame',
 'gi_running',
 'next',        #The method that runs the function's body.
 'send',
 'throw']

该gi_code和gi_frame字段是冻结状态的存储位置。用探索它们dir(..)，我们可以确认我们上面的心理模型是可信的。

— 叶夫根尼·谢尔盖夫（Evgeni Sergeev）
source

59

就像每个答案所建议的那样，yield用于创建序列生成器。它用于动态生成一些序列。例如，在网络上逐行读取文件时，可以使用以下yield功能：

def getNextLines():
   while con.isOpen():
       yield con.read()

您可以在代码中使用它，如下所示：

for line in getNextLines():
    doSomeThing(line)

执行控制转移陷阱

执行foryield时，执行控制将从getNextLines（）转移到循环中。因此，每次调用getNextLines（）时，都会从上次暂停的位置开始执行。

因此，简而言之，具有以下代码的函数

def simpleYield():
    yield "first time"
    yield "second time"
    yield "third time"
    yield "Now some useful value {}".format(12)

for i in simpleYield():
    print i

将打印

"first time"
"second time"
"third time"
"Now some useful value 12"

— 曼古·辛格·拉杰普罗希特（Mangu Singh Rajpurohit）
source

59

一个简单的例子来了解它是什么： yield

def f123():
    for _ in range(4):
        yield 1
        yield 2


for i in f123():
    print (i)

输出为：

1 2 1 2 1 2 1 2

— 加夫里尔·科恩（Gavriel Cohen）
source

5

您确定该输出吗？如果您使用来运行该打印语句，是否只能将其打印在一行上print(i, end=' ')？否则，我相信默认行为会将每个数字放到新行上

— user9074332

@ user9074332，您是对的，但将其写在一行上以促进理解

— Gavriel Cohen

57

（我下面的回答仅从使用Python生成器的角度讲，而不是生成器机制的基础实现，它涉及堆栈和堆操作的一些技巧。）

在python函数中yield使用when 代替a return时，该函数变成了一个特殊的名称generator function。该函数将返回一个generator类型的对象。该yield关键字是一个标志，通知蟒蛇编译器将特殊对待这样的功能。普通函数将在返回一些值后终止。但是在编译器的帮助下，可以将 generator函数视为可恢复的。也就是说，将恢复执行上下文，并且将从上次运行继续执行。在您显式调用return之前，它将引发StopIteration异常（这也是迭代器协议的一部分），或到达函数的结尾。我发现了很多关于引用的generator，但是这一个从中functional programming perspective最容易消化。

（现在，我想根据我自己的理解来讨论其背后的原理generator和iterator基础。我希望这可以帮助您掌握迭代器和生成器的基本动机。这种概念也出现在其他语言中，例如C＃。）

据我了解，当我们要处理一堆数据时，通常先将数据存储在某个地方，然后再逐一处理。但是这种幼稚的方法是有问题的。如果数据量巨大，则预先存储它们是很昂贵的。因此data，为什么不直接存储自身，为什么不metadata间接存储某种形式，即the logic how the data is computed。

有两种包装此类元数据的方法。

面向对象的方法，我们包装了元数据as a class。这就是所谓的iterator实现迭代器协议的人（即__next__()和__iter__()方法）。这也是常见的迭代器设计模式。
在功能方法上，我们包装了元数据as a function。这就是所谓的generator function。但是在后台，返回的generator object静态IS-A迭代器仍然存在，因为它也实现了迭代器协议。

无论哪种方式，都会创建一个迭代器，即某个可以为您提供所需数据的对象。OO方法可能有点复杂。无论如何，要使用哪一个取决于您。

— 维基百科
source

54

总之，该yield语句将您的函数转换为一个工厂，该工厂产生一个称为a的特殊对象，该对象generator环绕原始函数的主体。当generator被重复，直到它到达下一个执行的功能yield后停止执行，计算结果为传递给值yield。它将在每次迭代中重复此过程，直到执行路径退出函数为止。例如，

def simple_generator():
    yield 'one'
    yield 'two'
    yield 'three'

for i in simple_generator():
    print i

简单地输出

one
two
three

动力来自将生成器与计算序列的循环配合使用，生成器每次执行循环都会停止，以“产生”下一个计算结果，这样就可以即时计算列表，而好处是可以存储保存用于特别大的计算

假设您想创建自己的range函数来产生可迭代的数字范围，则可以这样做，

def myRangeNaive(i):
    n = 0
    range = []
    while n < i:
        range.append(n)
        n = n + 1
    return range

像这样使用

for i in myRangeNaive(10):
    print i

但这是低效的，因为

您创建只使用一次的数组（这会浪费内存）
这段代码实际上在该数组上循环了两次！:(

幸运的是，Guido和他的团队足够慷慨地开发发电机，因此我们可以做到这一点。

def myRangeSmart(i):
    n = 0
    while n < i:
       yield n
       n = n + 1
    return

for i in myRangeSmart(10):
    print i

现在，每次迭代时，生成器上的一个称为next()函数的函数都会执行该函数，直到达到“ yield”语句为止，该语句在该语句中停止并“屈服”值或到达函数的末尾。在这种情况下，在第一次调用时，next()执行到yield语句并产生yield'n'，在下一次调用时，它将执行递增语句，跳回到'while'，对其求值，如果为true，它将停止并再次产生yield'n'，它将继续以这种方式，直到while条件返回false且生成器跳到函数的末尾。

— 抢劫
source

53

产量是一个对象

return函数中的A 将返回单个值。

如果您希望函数返回大量值，请使用yield。

更重要的yield是，是一个障碍。

就像CUDA语言中的barrier一样，它在完成之前不会转移控制权。

也就是说，它将从头开始运行函数中的代码，直到命中为止yield。然后，它将返回循环的第一个值。

然后，其他所有调用将再次运行您在函数中编写的循环，返回下一个值，直到没有任何值可返回为止。

— 卡莱姆·乌拉（Kaleem Ullah）
source

52

许多人使用return而不是yield，但是在某些情况下yield可以更高效，更轻松地工作。

这是yield绝对适合的示例：

返回（函数中）

import random

def return_dates():
    dates = [] # With 'return' you need to create a list then return it
    for i in range(5):
        date = random.choice(["1st", "2nd", "3rd", "4th", "5th", "6th", "7th", "8th", "9th", "10th"])
        dates.append(date)
    return dates

产量（以功能计）

def yield_dates():
    for i in range(5):
        date = random.choice(["1st", "2nd", "3rd", "4th", "5th", "6th", "7th", "8th", "9th", "10th"])
        yield date # 'yield' makes a generator automatically which works
                   # in a similar way. This is much more efficient.

通话功能

dates_list = return_dates()
print(dates_list)
for i in dates_list:
    print(i)

dates_generator = yield_dates()
print(dates_generator)
for i in dates_generator:
    print(i)

这两个函数执行相同的操作，但是yield使用三行而不是五行，并且少担心一个变量。

这是代码的结果：

如您所见，两个函数都做同样的事情。唯一的区别是return_dates()提供列表和yield_dates()生成器。

现实生活中的例子可能是像逐行读取文件，或者只是想生成一个生成器。

— 汤姆·富勒
source

43

yield就像函数的返回元素一样。不同之处在于，yield元素将功能转换为生成器。生成器的行为就像一个函数，直到“屈服”为止。生成器停止运行，直到下一次调用为止，并从与启动完全相同的点继续运行。您可以通过调用来获得所有“屈服”值的序列list(generator())。

— 威尔·德雷汉姆
source

41

该yield关键字简单地收集返回结果。想想yield像return +=

— BahtiyarÖzdere
source

36

这是一种yield基于简单的方法来计算斐波那契数列，解释如下：

def fib(limit=50):
    a, b = 0, 1
    for i in range(limit):
       yield b
       a, b = b, a+b

当您将其输入到REPL中并尝试调用它时，您将得到一个神秘的结果：

>>> fib()
<generator object fib at 0x7fa38394e3b8>

这是因为存在yield向您发送信号的Python，您想要创建一个生成器，即一个按需生成值的对象。

那么，如何生成这些值？这可以通过使用内置函数直接完成，也可以next通过将其提供给使用值的构造间接完成。

使用内置next()函数，您可以直接调用.next/ __next__，强制生成器生成一个值：

>>> g = fib()
>>> next(g)
1
>>> next(g)
1
>>> next(g)
2
>>> next(g)
3
>>> next(g)
5

间接地，如果您提供fib给for循环，list初始化程序，tuple初始化程序或其他任何期望对象生成/产生值的对象，则将“消耗”生成器，直到无法再生成任何值（并且返回）：

results = []
for i in fib(30):       # consumes fib
    results.append(i) 
# can also be accomplished with
results = list(fib(30)) # consumes fib

同样，使用tuple初始化程序：

>>> tuple(fib(5))       # consumes fib
(1, 1, 2, 3, 5)

生成器在延迟方面与功能有所不同。它通过保持其本地状态并允许您在需要时恢复来实现此目的。

首次调用fib时：

f = fib()

Python编译函数，遇到yield关键字，然后简单地将生成器对象返回给您。看起来不是很有帮助。

然后，当您请求它直接或间接生成第一个值时，它将执行找到的所有语句，直到遇到a为止yield，然后返回您提供给它的值yield并暂停。为了更好地说明这一点，让我们使用一些print调用（print "text"在Python 2上用if 代替）：

def yielder(value):
    """ This is an infinite generator. Only use next on it """ 
    while 1:
        print("I'm going to generate the value for you")
        print("Then I'll pause for a while")
        yield value
        print("Let's go through it again.")

现在，输入REPL：

>>> gen = yielder("Hello, yield!")

您现在有了一个生成器对象，等待一个命令来生成一个值。使用next并查看打印出的内容：

>>> next(gen) # runs until it finds a yield
I'm going to generate the value for you
Then I'll pause for a while
'Hello, yield!'

未报价的结果是所打印的内容。引用的结果是从返回的结果yield。next现在再次致电：

>>> next(gen) # continues from yield and runs again
Let's go through it again.
I'm going to generate the value for you
Then I'll pause for a while
'Hello, yield!'

生成器会记住它在此处暂停yield value并从那里继续。打印下一条消息yield，并再次执行搜索以使其暂停的语句（由于while循环）。

— 迪米特里斯·法萨拉基斯·希利亚德（Dimitris Fasarakis Hilliard）
source

“ yield”关键字有什么作用？

可迭代

发电机

产量