Answers:
也许最干净的方法是使用np.repeat
:
a = np.array([[1, 2], [1, 2]])
print(a.shape)
# (2, 2)
# indexing with np.newaxis inserts a new 3rd dimension, which we then repeat the
# array along, (you can achieve the same effect by indexing with None, see below)
b = np.repeat(a[:, :, np.newaxis], 3, axis=2)
print(b.shape)
# (2, 2, 3)
print(b[:, :, 0])
# [[1 2]
# [1 2]]
print(b[:, :, 1])
# [[1 2]
# [1 2]]
print(b[:, :, 2])
# [[1 2]
# [1 2]]
话虽如此,您通常可以通过使用broadcast避免完全重复阵列。例如,假设我要添加一个(3,)
向量:
c = np.array([1, 2, 3])
到a
。我可以a
在第三维中复制3次的内容,然后c
在第一维和第二维中复制两次的内容,这样我的两个数组都是(2, 2, 3)
,然后计算它们的总和。但是,这样做更加简单快捷:
d = a[..., None] + c[None, None, :]
在此,a[..., None]
具有形状,(2, 2, 1)
并且c[None, None, :]
具有形状(1, 1, 3)
*。当我计算总和时,结果沿大小为1的维度“广播”出去,给了我shape的结果(2, 2, 3)
:
print(d.shape)
# (2, 2, 3)
print(d[..., 0]) # a + c[0]
# [[2 3]
# [2 3]]
print(d[..., 1]) # a + c[1]
# [[3 4]
# [3 4]]
print(d[..., 2]) # a + c[2]
# [[4 5]
# [4 5]]
广播是一项非常强大的技术,因为它避免了在内存中创建输入数组的重复副本所涉及的额外开销。
*尽管为清楚起见,我将它们包括在内,但实际上并不需要None
索引c
-您也可以这样做a[..., None] + c
,即(2, 2, 1)
针对(3,)
数组广播数组。这是因为,如果其中一个数组的尺寸小于另一个数组的尺寸,则仅两个数组的尾随尺寸需要兼容。举一个更复杂的例子:
a = np.ones((6, 1, 4, 3, 1)) # 6 x 1 x 4 x 3 x 1
b = np.ones((5, 1, 3, 2)) # 5 x 1 x 3 x 2
result = a + b # 6 x 5 x 4 x 3 x 2
np.newaxis
只是None
另一种方法是使用numpy.dstack
。假设您要重复矩阵a
num_repeats
时间:
import numpy as np
b = np.dstack([a]*num_repeats)
诀窍是将矩阵包装a
到单个元素的列表中,然后使用*
运算符在此列表中重复元素num_repeats
。
例如,如果:
a = np.array([[1, 2], [1, 2]])
num_repeats = 5
这将[1 2; 1 2]
在第三维中重复5次该数组。验证(在IPython中):
In [110]: import numpy as np
In [111]: num_repeats = 5
In [112]: a = np.array([[1, 2], [1, 2]])
In [113]: b = np.dstack([a]*num_repeats)
In [114]: b[:,:,0]
Out[114]:
array([[1, 2],
[1, 2]])
In [115]: b[:,:,1]
Out[115]:
array([[1, 2],
[1, 2]])
In [116]: b[:,:,2]
Out[116]:
array([[1, 2],
[1, 2]])
In [117]: b[:,:,3]
Out[117]:
array([[1, 2],
[1, 2]])
In [118]: b[:,:,4]
Out[118]:
array([[1, 2],
[1, 2]])
In [119]: b.shape
Out[119]: (2, 2, 5)
最后,我们可以看到矩阵的形状为2 x 2
,在第三维中有5个切片。
reshape
呢?快点?给出相同的结构?它绝对整洁。
n-dim
数组扩展为n+1-dim
在NumPy中1.10.0
引入后,我们可以利用它numpy.broadcast_to
来简单地生成输入数组的3D
视图2D
。好处将是没有额外的内存开销和几乎免费的运行时。这在数组很大且我们可以使用视图的情况下至关重要。同样,这将适用于一般n-dim
情况。
我会用单词stack
代替copy
,因为读者可能会将它与创建内存副本的数组的复制混淆。
沿第一轴堆叠
如果我们要arr
沿第一个轴堆叠输入,np.broadcast_to
创建3D
视图的解决方案将是-
np.broadcast_to(arr,(3,)+arr.shape) # N = 3 here
沿第三个/最后一个轴堆叠
要arr
沿第三轴堆叠输入,创建3D
视图的解决方案是-
np.broadcast_to(arr[...,None],arr.shape+(3,))
如果我们确实需要一个内存副本,那么我们总是可以在此追加.copy()
。因此,解决方案将是-
np.broadcast_to(arr,(3,)+arr.shape).copy()
np.broadcast_to(arr[...,None],arr.shape+(3,)).copy()
这是两种情况下堆叠的工作方式,并显示了样品箱的形状信息-
# Create a sample input array of shape (4,5)
In [55]: arr = np.random.rand(4,5)
# Stack along first axis
In [56]: np.broadcast_to(arr,(3,)+arr.shape).shape
Out[56]: (3, 4, 5)
# Stack along third axis
In [57]: np.broadcast_to(arr[...,None],arr.shape+(3,)).shape
Out[57]: (4, 5, 3)
相同的解决方案可以用来扩展n-dim
输入以n+1-dim
沿第一个轴和最后一个轴查看输出。让我们探讨一些更暗淡的情况-
3D输入盒:
In [58]: arr = np.random.rand(4,5,6)
# Stack along first axis
In [59]: np.broadcast_to(arr,(3,)+arr.shape).shape
Out[59]: (3, 4, 5, 6)
# Stack along last axis
In [60]: np.broadcast_to(arr[...,None],arr.shape+(3,)).shape
Out[60]: (4, 5, 6, 3)
4D输入盒:
In [61]: arr = np.random.rand(4,5,6,7)
# Stack along first axis
In [62]: np.broadcast_to(arr,(3,)+arr.shape).shape
Out[62]: (3, 4, 5, 6, 7)
# Stack along last axis
In [63]: np.broadcast_to(arr[...,None],arr.shape+(3,)).shape
Out[63]: (4, 5, 6, 7, 3)
等等。
让我们使用一个大样本示例2D
,获取时间并验证输出是否为view
。
# Sample input array
In [19]: arr = np.random.rand(1000,1000)
让我们证明所提出的解决方案确实是一种观点。我们将使用沿第一轴的堆叠(沿第三轴的堆叠结果非常相似)-
In [22]: np.shares_memory(arr, np.broadcast_to(arr,(3,)+arr.shape))
Out[22]: True
让我们来说明一下它实际上是免费的-
In [20]: %timeit np.broadcast_to(arr,(3,)+arr.shape)
100000 loops, best of 3: 3.56 µs per loop
In [21]: %timeit np.broadcast_to(arr,(3000,)+arr.shape)
100000 loops, best of 3: 3.51 µs per loop
N
从观点来看,在时序上从3
增加到3000
不变,并且在时序单位上两者都可以忽略不计。因此,在内存和性能上都非常有效!
A=np.array([[1,2],[3,4]])
B=np.asarray([A]*N)
编辑@ Mr.F,以保留尺寸顺序:
B=B.T
B.shape
打印。如果与进行转置,则它与预期输出匹配。(N, 2, 2)
N
B
B.T
B[0], B[1],...
将为您提供正确的切片,我将说这是更容易键入而不是使用B[:,:,0], B[:,:,1]
等等的类
B[:,:,i]
我习惯的。
b[:,:,0]
,b[:,:,1]
和b[:,:,2]
。每个三维切片都是原始2D数组的副本。单看就不太明显了print(b)
。