multiprocessing.Pool：何时使用apply，apply_async或map？

290

我还没有看到关于Pool.apply，Pool.apply_async和Pool.map用例的清晰示例。我主要使用Pool.map; 别人的优势是什么？

— Phyo Arkar Lwin
source

Answers:

424

在Python的早期，要使用任意参数调用函数，可以使用apply：

apply(f,args,kwargs)

apply尽管在Python2.7中仍然存在，但在Python3中仍然存在，并且通常不再使用。如今，

f(*args,**kwargs)

是首选。这些multiprocessing.Pool模块尝试提供类似的接口。

Pool.apply就像Python一样apply，不同之处在于函数调用是在单独的进程中执行的。Pool.apply直到功能完成为止。

Pool.apply_async也类似于Python的内置函数apply，除了调用立即返回而不是等待结果而已。AsyncResult返回一个对象。您调用其get()方法以检索函数调用的结果。该get()方法将阻塞直到功能完成。因此，pool.apply(func, args, kwargs)等效于pool.apply_async(func, args, kwargs).get()。

与相比Pool.apply，该Pool.apply_async方法还具有一个回调，如果提供该回调，则在函数完成时调用该回调。可以使用它来代替get()。

例如：

import multiprocessing as mp
import time

def foo_pool(x):
    time.sleep(2)
    return x*x

result_list = []
def log_result(result):
    # This is called whenever foo_pool(i) returns a result.
    # result_list is modified only by the main process, not the pool workers.
    result_list.append(result)

def apply_async_with_callback():
    pool = mp.Pool()
    for i in range(10):
        pool.apply_async(foo_pool, args = (i, ), callback = log_result)
    pool.close()
    pool.join()
    print(result_list)

if __name__ == '__main__':
    apply_async_with_callback()

可能会产生如下结果

[1, 0, 4, 9, 25, 16, 49, 36, 81, 64]

请注意，与不同pool.map，结果的顺序可能与pool.apply_async调用的顺序不同。

因此，如果您需要在一个单独的进程中运行一个函数，但是希望当前进程在该函数返回之前一直阻塞，请使用Pool.apply。像一样Pool.apply，Pool.map阻塞直到返回完整的结果。

如果希望工作进程池异步执行许多功能调用，请使用Pool.apply_async。结果的顺序不能保证与调用的顺序相同Pool.apply_async。

还要注意，您可以使用调用许多不同的函数Pool.apply_async（并非所有调用都需要使用同一函数）。

相反，Pool.map将相同的函数应用于许多参数。但是，与不同Pool.apply_async，结果按与参数顺序相对应的顺序返回。

— Unutbu
source

如果有if __name__=="__main__"之前apply_async_with_callback()在Windows？

— jfs

非常感谢。map_async呢？

— Phyo Arkar Lwin 2011年

查看multiprocessing / pool.py内部，您将看到Pool.map(func,iterable)等同于Pool.map_async(func,iterable).get()。所以之间的关系Pool.map，并Pool.map_async为类似的Pool.apply和Pool.apply_async。的async命令立即返回，而非async的命令块。这些async命令还具有回调。

— unutbu 2011年

使用之间的决定Pool.map和Pool.apply类似决定何时使用map或applyPython编写的。您只需要使用适合工作的工具即可。在使用版本async和非async版本之间进行选择取决于您是否希望调用阻塞当前进程和/或是否使用回调。

— unutbu

@falsePockets：是的。每次调用都会apply_async返回一个ApplyResult对象。调用该ApplyResult的get方法将返回相关的函数的返回值（或提高mp.TimeoutError如果呼叫超时的。）所以，如果你把ApplyResultS IN的有序列表，然后调用他们的get方法将在相同的顺序返回结果。但是，您只能pool.map在这种情况下使用。

— unutbu

关于applyvs map：

pool.apply(f, args)：f仅在池中的一个工作线程中执行。因此，池中的一个进程将运行f(args)。

pool.map(f, iterable)：此方法将可迭代项分为多个块，将其作为单独的任务提交给流程池。因此，您可以利用池中的所有进程。

— 卡赫
source

如果迭代器是生成器

— 怎么办

嗯...好问题。老实说，我从未使用过带有生成器的池，但是该线程可能会有所帮助：stackoverflow.com/questions/5318936/…–

— kakhkAtion

@kakhkAtion关于适用，如果只有一名工人执行该功能，其余工人会做什么？我是否需要多次致电申请才能让其余工人执行任务？

— Moondra'7

真正。如果您想异步给员工吃午餐，也请看看pool.apply_async。“ pool_apply阻塞，直到结果准备好为止，因此apply_async（）更适合并行执行工作”

— kakhkAtion

当我有4个进程但调用了apply_async()8次时会发生什么？它会自动处理队列吗？

— Saravanabalagi Ramachandran

以下是在一个表的格式，以显示之间的差异的概述Pool.apply，Pool.apply_async，Pool.map和Pool.map_async。选择一个时，必须考虑多个参数，并发性，阻塞和排序：

                  | Multi-args   Concurrence    Blocking     Ordered-results
---------------------------------------------------------------------
Pool.map          | no           yes            yes          yes
Pool.map_async    | no           yes            no           yes
Pool.apply        | yes          no             yes          no
Pool.apply_async  | yes          yes            no           no
Pool.starmap      | yes          yes            yes          yes
Pool.starmap_async| yes          yes            no           no

笔记：

Pool.imap和Pool.imap_async–地图和map_async的惰性版本。
Pool.starmap 方法，除了接受多个参数外，与map方法非常相似。
Async方法一次提交所有流程，并在完成后检索结果。使用get方法获取结果。
Pool.map（或Pool.apply）方法与Python内置map（或套用）非常相似。它们阻塞主流程，直到所有流程完成并返回结果。

例子：

地图

一次调用一份工作清单

results = pool.map(func, [1, 2, 3])

应用

只能被要求一份工作

for x, y in [[1, 1], [2, 2]]:
    results.append(pool.apply(func, (x, y)))

def collect_result(result):
    results.append(result)

map_async

一次调用一份工作清单

pool.map_async(func, jobs, callback=collect_result)

apply_async

只能调用一个作业并在后台并行执行一个作业

for x, y in [[1, 1], [2, 2]]:
    pool.apply_async(worker, (x, y), callback=collect_result)

星图

是pool.map支持多个参数的变体

pool.starmap(func, [(1, 1), (2, 1), (3, 1)])

starmap_async

starmap（）和map_async（）的组合，它对可迭代的可迭代对象进行迭代，并在未包装可迭代对象的情况下调用func。返回结果对象。

pool.starmap_async(calculate_worker, [(1, 1), (2, 1), (3, 1)], callback=collect_result)

参考：

在此处找到完整的文档：https : //docs.python.org/3/library/multiprocessing.html

— 雷内·B。
source

Pool.starmap（）被阻止

— Alan Evangelista