在共享内存中使用numpy数组进行多处理


110

我想在共享内存中使用一个numpy数组,以便与多处理模块一起使用。困难是像numpy数组一样使用它,而不仅仅是ctypes数组。

from multiprocessing import Process, Array
import scipy

def f(a):
    a[0] = -a[0]

if __name__ == '__main__':
    # Create the array
    N = int(10)
    unshared_arr = scipy.rand(N)
    arr = Array('d', unshared_arr)
    print "Originally, the first two elements of arr = %s"%(arr[:2])

    # Create, start, and finish the child processes
    p = Process(target=f, args=(arr,))
    p.start()
    p.join()

    # Printing out the changed values
    print "Now, the first two elements of arr = %s"%arr[:2]

这将产生如下输出:

Originally, the first two elements of arr = [0.3518653236697369, 0.517794725524976]
Now, the first two elements of arr = [-0.3518653236697369, 0.517794725524976]

可以ctypes方式访问该数组,例如arr[i]说得通。但是,它不是一个numpy数组,因此我无法执行-1*arr,或arr.sum()。我想一个解决方案是将ctypes数组转换为numpy数组。但是(除了无法完成这项工作之外),我不相信会再共享它。

对于必须解决的常见问题,似乎将有一个标准解决方案。



1
这不是一个完全相同的问题。链接的问题不是在询问subprocess而是在询问multiprocessing
安德鲁

Answers:


81

要添加到@unutbu(不再可用)和@Henry Gomersall的答案中。您可以shared_arr.get_lock()在需要时使用来同步访问:

shared_arr = mp.Array(ctypes.c_double, N)
# ...
def f(i): # could be anything numpy accepts as an index such another numpy array
    with shared_arr.get_lock(): # synchronize access
        arr = np.frombuffer(shared_arr.get_obj()) # no data copying
        arr[i] = -arr[i]

import ctypes
import logging
import multiprocessing as mp

from contextlib import closing

import numpy as np

info = mp.get_logger().info

def main():
    logger = mp.log_to_stderr()
    logger.setLevel(logging.INFO)

    # create shared array
    N, M = 100, 11
    shared_arr = mp.Array(ctypes.c_double, N)
    arr = tonumpyarray(shared_arr)

    # fill with random values
    arr[:] = np.random.uniform(size=N)
    arr_orig = arr.copy()

    # write to arr from different processes
    with closing(mp.Pool(initializer=init, initargs=(shared_arr,))) as p:
        # many processes access the same slice
        stop_f = N // 10
        p.map_async(f, [slice(stop_f)]*M)

        # many processes access different slices of the same array
        assert M % 2 # odd
        step = N // 10
        p.map_async(g, [slice(i, i + step) for i in range(stop_f, N, step)])
    p.join()
    assert np.allclose(((-1)**M)*tonumpyarray(shared_arr), arr_orig)

def init(shared_arr_):
    global shared_arr
    shared_arr = shared_arr_ # must be inherited, not passed as an argument

def tonumpyarray(mp_arr):
    return np.frombuffer(mp_arr.get_obj())

def f(i):
    """synchronized."""
    with shared_arr.get_lock(): # synchronize access
        g(i)

def g(i):
    """no synchronization."""
    info("start %s" % (i,))
    arr = tonumpyarray(shared_arr)
    arr[i] = -1 * arr[i]
    info("end   %s" % (i,))

if __name__ == '__main__':
    mp.freeze_support()
    main()

如果您不需要同步访问或创建自己的锁,则mp.Array()没有必要。mp.sharedctypes.RawArray在这种情况下,您可以使用。


2
漂亮的答案!如果我要拥有多个共享数组,每个共享数组都可以分别锁定,但是要在运行时确定数组的数量,这是对此处所做工作的直接扩展吗?
2013年

3
@Andrew:应在生成子进程之前创建共享数组。
jfs

关于操作顺序的要点。不过,这就是我的初衷:创建用户指定数量的共享数组,然后生成一些子进程。那简单吗?
安德鲁

1
@Chicony:您不能更改数组的大小。可以将其视为在子进程启动之前必须分配的共享内存块。您不需要使用所有内存,例如,您可以传递countnumpy.frombuffer()。您可以尝试使用mmap或类似类似的方法在较低级别上执行此操作,posix_ipc以实现可调整大小的(可能需要在调整大小的同时进行复制)RawArray模拟(或寻找现有的库)。或者,如果您的任务允许:分部分复制数据(如果不需要一次全部复制)。“如何调整共享内存的大小”是一个很好的单独问题。
jfs

1
@umopapisdn:Pool()定义进程数(默认使用可用的CPU内核数)。Mf()函数被调用的次数。
jfs

21

Array对象具有get_obj()与之关联的方法,该方法返回呈现缓冲区接口的ctypes数组。我认为以下应该起作用...

from multiprocessing import Process, Array
import scipy
import numpy

def f(a):
    a[0] = -a[0]

if __name__ == '__main__':
    # Create the array
    N = int(10)
    unshared_arr = scipy.rand(N)
    a = Array('d', unshared_arr)
    print "Originally, the first two elements of arr = %s"%(a[:2])

    # Create, start, and finish the child process
    p = Process(target=f, args=(a,))
    p.start()
    p.join()

    # Print out the changed values
    print "Now, the first two elements of arr = %s"%a[:2]

    b = numpy.frombuffer(a.get_obj())

    b[0] = 10.0
    print a[0]

运行时,它将打印出现在的第一个元素a10.0,显示ab只是进入同一内存的两个视图。

为了确保它仍然是多处理器安全的,我相信您将必须使用对象acquirerelease上存在的方法,以及其内置的锁以确保可以安全地访问所有对象(尽管我不是专家)多处理器模块)。Arraya


如@unutbu在他(现已删除)的答案中所展示的,没有同步就无法工作。
jfs

1
大概,如果您只是想访问数组后处理,那么可以干净地完成它而不必担心并发问题和锁定?
亨利·戈默索尔

在这种情况下,您不需要mp.Array
jfs

1
处理代码可能需要锁定的数组,但是数据的后处理解释可能不一定。我想这是由于了解了问题所在。显然,同时访问共享数据将需要一些保护,我认为这很明显!
亨利·戈默索尔

16

尽管已经给出了很好的答案,但是只要满足两个条件,就可以轻松解决此问题:

  1. 您使用的是POSIX兼容的操作系统(例如Linux,Mac OSX);和
  2. 您的子进程需要对共享阵列的只读访问权限

在这种情况下,您无需费心地显式地使变量共享,因为将使用派生来创建子进程。分叉的孩子会自动共享父母的内存空间。在Python多处理的上下文中,这意味着它共享所有模块级变量;请注意,这不适用于您显式传递给子进程或传递给a multiprocessing.Pool或此类函数的参数。

一个简单的例子:

import multiprocessing
import numpy as np

# will hold the (implicitly mem-shared) data
data_array = None

# child worker function
def job_handler(num):
    # built-in id() returns unique memory ID of a variable
    return id(data_array), np.sum(data_array)

def launch_jobs(data, num_jobs=5, num_worker=4):
    global data_array
    data_array = data

    pool = multiprocessing.Pool(num_worker)
    return pool.map(job_handler, range(num_jobs))

# create some random data and execute the child jobs
mem_ids, sumvals = zip(*launch_jobs(np.random.rand(10)))

# this will print 'True' on POSIX OS, since the data was shared
print(np.all(np.asarray(mem_ids) == id(data_array)))

3
+1真正有价值的信息。您能否解释为什么仅共享模块级var?为什么局部变量不属于父级的内存空间?例如,如果我有一个带有局部变量V的函数F和一个在F内引用V的函数G,为什么不能正常工作?
Coffee_Table

5
警告:这个答案有点欺骗性。子进程在派生时会收到父进程状态的副本,包括全局变量。这些状态绝不会同步,并且从那一刻开始会有所不同。该技术在某些情况下可能很有用(例如:派生分别处理父进程快照然后终止的临时子进程),但在其他情况下则无用(例如:必须共享和运行的长时间运行的子进程)与父进程同步数据)。
大卫·斯坦

4
@EelkeSpaak:您的陈述-“分叉的孩子自动共享父母的内存空间”-是不正确的。如果我有一个子进程要监视父进程的状态(严格地以只读方式),则派生将不会使我到达那里:在派生时,子进程只会看到父状态的快照。实际上,这正是我发现此限制时想要做的事情(按照您的回答)。因此,您的答案附有后记。简而言之:父状态不是“共享的”,而只是复制到子状态。在通常意义上,这不是“共享”。
大卫·斯坦

2
我是否误以为至少在posix系统上是写时复制的情况?也就是说,在派生之后,我认为内存是共享的,直到写入新数据为止,此时将创建副本。因此,是的,确实没有完全“共享”数据,但这确实可以极大地提高性能。如果您的进程是只读的,那么将没有复制开销!我是否正确理解了这一点?
senderle '18 -10-31

2
@senderle是的,这正是我的意思!因此,我关于只读访问的答案的观点(2)。
EelkeSpaak '18

11

我编写了一个小的python模块,该模块使用POSIX共享内存在python解释器之间共享numpy数组。也许您会发现它很方便。

https://pypi.python.org/pypi/SharedArray

运作方式如下:

import numpy as np
import SharedArray as sa

# Create an array in shared memory
a = sa.create("test1", 10)

# Attach it as a different array. This can be done from another
# python interpreter as long as it runs on the same computer.
b = sa.attach("test1")

# See how they are actually sharing the same memory block
a[0] = 42
print(b[0])

# Destroying a does not affect b.
del a
print(b[0])

# See how "test1" is still present in shared memory even though we
# destroyed the array a.
sa.list()

# Now destroy the array "test1" from memory.
sa.delete("test1")

# The array b is not affected, but once you destroy it then the
# data are lost.
print(b[0])

8

您可以使用以下sharedmem模块:https : //bitbucket.org/cleemesser/numpy-sharedmem

然后,这是您的原始代码,这一次使用行为类似于NumPy数组的共享内存(请注意调用NumPy sum()函数的其他最后一条语句):

from multiprocessing import Process
import sharedmem
import scipy

def f(a):
    a[0] = -a[0]

if __name__ == '__main__':
    # Create the array
    N = int(10)
    unshared_arr = scipy.rand(N)
    arr = sharedmem.empty(N)
    arr[:] = unshared_arr.copy()
    print "Originally, the first two elements of arr = %s"%(arr[:2])

    # Create, start, and finish the child process
    p = Process(target=f, args=(arr,))
    p.start()
    p.join()

    # Print out the changed values
    print "Now, the first two elements of arr = %s"%arr[:2]

    # Perform some NumPy operation
    print arr.sum()

1
注意:这已不再开发,并且似乎无法在linux上运行github.com/sturlamolden/sharedmem-numpy/issues/4
AD

numpy-sharedmem可能尚未开发,但仍可在Linux上运行,请查看github.com/vmlaker/benchmark-sharedmem
Velimir Mlaker,2016年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.