如何将新行添加到空的numpy数组


157

使用标准的Python数组,我可以执行以下操作:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

但是,我不能在numpy中做同样的事情。例如:

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

我也研究了vstack,但是在vstack空数组上使用时,得到:

ValueError: all the input array dimensions except for the concatenation axis must match exactly

那么,如何将新行追加到numpy中的空数组中?


1
如果是空的,为什么要打扰?只需从仅保留第一行的数组开始。
jonrsharpe 2014年

10
我只想知道是否有可能追加到一个空的numpy数组。有时,这样编写代码会更加干净,因为追加操作处于循环中。
托尼·史塔克

5
鉴于方式numpy的阵列的工作,你有更好的构建一个空数组,然后把数据,如见stackoverflow.com/questions/568962/...
jonrsharpe

Answers:


227

“启动”所需阵列的方法是:

arr = np.empty((0,3), int)

这是一个空数组,但具有适当的维数。

>>> arr
array([], shape=(0, 3), dtype=int64)

然后确保沿轴0附加:

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

但是,@ jonrsharpe是正确的。实际上,如果要循环添加,那么像第一个示例中那样将其添加到列表中会更快得多,然后最后转换为numpy数组,因为您实际上并没有使用numpy作为打算在循环中:

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

numpythonic的实现方法取决于您的应用程序,但它更像是:

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True

如果我必须做10 ^ 5或10 ^ 6次怎么办?这些方法似乎都不成立。有什么建议吗?
罗披岛

@Roberto,通常有一些方法可以预先确定数组的大小或形状(至少,值是可取的)。您认为可以做到吗?追加实际上应该是一两次操作。
askewchan '16

有时您无法猜测尺寸,这就是生命。但是,您可以分配足够大的数组并为其视图提供值。但是我不喜欢它,因为有一些不必要的值必须找到一种“掩盖”的方法。这种遮罩的想法确实不符合我的口味。
罗披岛

无需遮罩,只需切片!a = a[:N] 尽管我坚信您应该找到一种向量化方法(如果需要帮助,可以用具体信息发布新问题),或者仅使用列表,直到循环结束。
askewchan '16

29

这是我的解决方案:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
np_arr = np.array(arr)

结果数组具有dtype对象,在某些情况下是不可接受的
zer0fool

26

在这种情况下,您可能需要使用np.hstack和np.vstack函数

arr = np.array([])
arr = np.hstack((arr, np.array([1,2,3])))
# arr is now [1,2,3]

arr = np.vstack((arr, np.array([4,5,6])))
# arr is now [[1,2,3],[4,5,6]]

您也可以使用np.concatenate函数。

干杯


7
如果第二个数组的维数大于等于2((2,2)),将不起作用。在我看来,如果要通过串联从空中建立阵列,则无法避免边界情况。
桃子2015年

这不是一个好的解决方案,因为每次都需要检查尺寸。
SKR

1

使用自定义dtype定义,对我有用的是:

import numpy

# define custom dtype
type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)])
# declare empty array, zero rows but one column
arr = numpy.empty([0,1],dtype=type1)
# store row data, maybe inside a loop
row = numpy.array([(0.0001, 0.002)], dtype=type1)
# append row to the main array
arr = numpy.row_stack((arr, row))
# print values stored in the row 0
print float(arr[0]['freq'])
print float(arr[0]['amplitude'])

1

如果要为循环中的数组添加新行,请直接为首次循环中的数组分配数组,而不是初始化一个空数组。

for i in range(0,len(0,100)):
    SOMECALCULATEDARRAY = .......
    if(i==0):
        finalArrayCollection = SOMECALCULATEDARRAY
    else:
        finalArrayCollection = np.vstack(finalArrayCollection,SOMECALCULATEDARRAY)

当阵列的形状未知时,这主要有用


0

我想做一个for循环,但是用askewchan的方法效果不好,所以我修改了它。

x=np.empty((0,3))
y=np.array([1 2 3])
for i in ...
x = vstack((x,y))
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.