假设给出以下数组:
a = array([1,3,5])
b = array([2,4,6])
一个人如何有效地交织它们,以便获得这样的第三个数组
c = array([1,2,3,4,5,6])
可以假设length(a)==length(b)
。
Answers:
我喜欢乔希的回答。我只是想添加一个更平凡,平常且稍微冗长的解决方案。我不知道哪个更有效。我希望他们会有类似的表现。
import numpy as np
a = np.array([1,3,5])
b = np.array([2,4,6])
c = np.empty((a.size + b.size,), dtype=a.dtype)
c[0::2] = a
c[1::2] = b
timeit
如果某个特定的操作是代码的瓶颈,则值得一试来进行测试。通常,在numpy中有多种处理方法,因此绝对是概要文件代码段。
.reshape
创建一个数组的额外副本,那么这可以解释2倍的性能下降。但是,我认为它并不总是能够复制。我猜5倍差异仅适用于小型阵列?
.flags
并测试.base
我的解决方案,看起来好像改成“ F”格式会创建vstacked数据的隐藏副本,所以这不是我想的那样简单的视图。奇怪的是5x由于某种原因仅适用于中等大小的阵列。
n
用n-1
物品编织物品。
我认为可能值得检查解决方案在性能方面的表现。结果如下:
这清楚地表明,最被支持和接受的答案(Pauls答案)也是最快的选择。
该代码取自其他答案和另一个问答:
# Setup
import numpy as np
def Paul(a, b):
c = np.empty((a.size + b.size,), dtype=a.dtype)
c[0::2] = a
c[1::2] = b
return c
def JoshAdel(a, b):
return np.vstack((a,b)).reshape((-1,),order='F')
def xioxox(a, b):
return np.ravel(np.column_stack((a,b)))
def Benjamin(a, b):
return np.vstack((a,b)).ravel([-1])
def andersonvom(a, b):
return np.hstack( zip(a,b) )
def bhanukiran(a, b):
return np.dstack((a,b)).flatten()
def Tai(a, b):
return np.insert(b, obj=range(a.shape[0]), values=a)
def Will(a, b):
return np.ravel((a,b), order='F')
# Timing setup
timings = {Paul: [], JoshAdel: [], xioxox: [], Benjamin: [], andersonvom: [], bhanukiran: [], Tai: [], Will: []}
sizes = [2**i for i in range(1, 20, 2)]
# Timing
for size in sizes:
func_input1 = np.random.random(size=size)
func_input2 = np.random.random(size=size)
for func in timings:
res = %timeit -o func(func_input1, func_input2)
timings[func].append(res)
%matplotlib notebook
import matplotlib.pyplot as plt
import numpy as np
fig = plt.figure(1)
ax = plt.subplot(111)
for func in timings:
ax.plot(sizes,
[time.best for time in timings[func]],
label=func.__name__) # you could also use "func.__name__" here instead
ax.set_xscale('log')
ax.set_yscale('log')
ax.set_xlabel('size')
ax.set_ylabel('time [seconds]')
ax.grid(which='both')
ax.legend()
plt.tight_layout()
万一您有可用的numba,也可以使用它来创建一个函数:
import numba as nb
@nb.njit
def numba_interweave(arr1, arr2):
res = np.empty(arr1.size + arr2.size, dtype=arr1.dtype)
for idx, (item1, item2) in enumerate(zip(arr1, arr2)):
res[idx*2] = item1
res[idx*2+1] = item2
return res
它可能比其他替代方案要快一些:
roundrobin()
从迭代工具的食谱。
这里是单线:
c = numpy.vstack((a,b)).reshape((-1,),order='F')
numpy.vstack((a,b)).interweave()
:)
.interleave()
亲自调用该函数的:)
reshape
办?
这是一个比以前的答案更简单的答案
import numpy as np
a = np.array([1,3,5])
b = np.array([2,4,6])
inter = np.ravel(np.column_stack((a,b)))
之后inter
包含:
array([1, 2, 3, 4, 5, 6])
这个答案似乎也快一些:
In [4]: %timeit np.ravel(np.column_stack((a,b)))
100000 loops, best of 3: 6.31 µs per loop
In [8]: %timeit np.ravel(np.dstack((a,b)))
100000 loops, best of 3: 7.14 µs per loop
In [11]: %timeit np.vstack((a,b)).ravel([-1])
100000 loops, best of 3: 7.08 µs per loop
这将交错/交错两个数组,我相信它是很可读的:
a = np.array([1,3,5]) #=> array([1, 3, 5])
b = np.array([2,4,6]) #=> array([2, 4, 6])
c = np.hstack( zip(a,b) ) #=> array([1, 2, 3, 4, 5, 6])
zip
在list
避免折旧警告
vstack
当然是一种选择,但针对您的情况更直接的解决方案可能是 hstack
>>> a = array([1,3,5])
>>> b = array([2,4,6])
>>> hstack((a,b)) #remember it is a tuple of arrays that this function swallows in.
>>> array([1, 3, 5, 2, 4, 6])
>>> sort(hstack((a,b)))
>>> array([1, 2, 3, 4, 5, 6])
更重要的是,这适用于任意形状的a
和b
另外你可能想尝试一下 dstack
>>> a = array([1,3,5])
>>> b = array([2,4,6])
>>> dstack((a,b)).flatten()
>>> array([1, 2, 3, 4, 5, 6])
您现在有选择!
也可以尝试一下np.insert
。(解决方案从Interleave numpy数组迁移)
import numpy as np
a = np.array([1,3,5])
b = np.array([2,4,6])
np.insert(b, obj=range(a.shape[0]), values=a)
请参阅documentation
和tutorial
了解更多信息。
我需要执行此操作,但要沿任意轴使用多维数组。这是实现此目的的快速通用功能。它具有与相同的调用签名np.concatenate
,除了所有输入数组必须具有完全相同的形状。
import numpy as np
def interleave(arrays, axis=0, out=None):
shape = list(np.asanyarray(arrays[0]).shape)
if axis < 0:
axis += len(shape)
assert 0 <= axis < len(shape), "'axis' is out of bounds"
if out is not None:
out = out.reshape(shape[:axis+1] + [len(arrays)] + shape[axis+1:])
shape[axis] = -1
return np.stack(arrays, axis=axis+1, out=out).reshape(shape)