numpy数组和矩阵有什么区别?我应该使用哪一个?


345

每种都有哪些优点和缺点?

从我所看到的情况来看,如果需要,任何一个都可以替代另一个,所以我应该同时使用这两个还是应该仅使用其中之一?

程序的样式会影响我的选择吗?我正在使用numpy进行一些机器学习,因此确实有很多矩阵,但也有很多向量(数组)。


3
我没有足够的信息来证明答案的正确性,但据我所知,主要的区别是乘法的实现。矩阵执行矩阵/张量乘法,而数组执行逐元素乘法。
Mike Axiak 2010年

5
Python 3.5添加了用于矩阵乘法的infix @运算符(PEP 465),并且NumPy 1.10添加了对此的支持。所以,如果你正在使用Python 3.5+和NumPy的1.10+,那么你可以随便写A @ B的,而不是A.dot(B),这里AB是2D ndarray秒。这消除了使用恕我直言matrix代替平原ndarray的主要优势。
MiniQuark '16

Answers:



396

numpy的矩阵是严格2维的,而numpy的阵列(ndarrays)是N维的。矩阵对象是ndarray的子​​类,因此它们继承了ndarray的所有属性和方法。

numpy矩阵的主要优点是它们为矩阵乘法提供了一种方便的表示法:如果a和b是矩阵,则a*b它们是矩阵乘积。

import numpy as np

a = np.mat('4 3; 2 1')
b = np.mat('1 2; 3 4')
print(a)
# [[4 3]
#  [2 1]]
print(b)
# [[1 2]
#  [3 4]]
print(a*b)
# [[13 20]
#  [ 5  8]]

另一方面,从Python 3.5开始,NumPy使用@运算符支持中缀矩阵乘法,因此您可以在Python> = 3.5中使用ndarrays实现相同的矩阵乘法便捷性。

import numpy as np

a = np.array([[4, 3], [2, 1]])
b = np.array([[1, 2], [3, 4]])
print(a@b)
# [[13 20]
#  [ 5  8]]

矩阵对象和ndarray都.T必须返回转置,但是矩阵对象也必须具有.H共轭转置和.I逆。

相反,numpy数组始终遵守以元素为单位应用操作的规则(除了new @运算符)。因此,如果ab是numpy数组,则a*b该数组是通过按元素逐个乘以组成的:

c = np.array([[4, 3], [2, 1]])
d = np.array([[1, 2], [3, 4]])
print(c*d)
# [[4 6]
#  [6 4]]

要获得矩阵乘法的结果,请使用np.dot(或@在Python> = 3.5中,如上所示):

print(np.dot(c,d))
# [[13 20]
#  [ 5  8]]

**运营商还表现不同:

print(a**2)
# [[22 15]
#  [10  7]]
print(c**2)
# [[16  9]
#  [ 4  1]]

由于a是矩阵,所以a**2返回矩阵乘积a*a。由于c是ndarray,因此c**2返回一个ndarray,每个组件的元素均平方。

矩阵对象和ndarray之间还有其他技术差异(与np.ravel,项目选择和序列行为有关)。

numpy数组的主要优点是它们比二维矩阵更通用。当您需要3维数组时会发生什么?然后,您必须使用ndarray,而不是矩阵对象。因此,学习使用矩阵对象的工作量更大-您必须学习矩阵对象操作和ndarray操作。

编写一个将矩阵和数组混合在一起的程序会使您的生活变得困难,因为您必须跟踪变量是什么类型的对象,以免乘法返回您不期望的东西。

相反,如果仅使用ndarray,则可以执行矩阵对象可以执行的所有操作,以及更多操作,但功能/符号略有不同。

如果您愿意放弃NumPy矩阵产品表示法的视觉吸引力(使用python> = 3.5的ndarrays几乎可以优雅地实现),那么我认为NumPy数组绝对是可行的方法。

PS。当然,您实际上不必选择以牺牲另一个为代价,因为np.asmatrixnp.asarray允许您将一个转换为另一个(只要数组是二维的)。


还有就是与NumPy之间的差异大纲arraysVS NumPy的matrixES 这里


7
对于那些想知道,mat**n对于一个矩阵可以粗暴应用于阵列与reduce(np.dot, [arr]*n)
askewchan

6
或者只是np.linalg.matrix_power(mat, n)
Eric

我想知道矩阵是否会更快...您会认为它们执行的检查要比ndarray少。
PascalVKooten

1
实际上,timeit测试显示ndarray操作np.dot(array2, array2)比快matrix1*matrix2。这是有道理的,因为它matrix是ndarray的子​​类,它覆盖了诸如之类的特殊方法__mul__matrix.__mul__来电np.dot。因此,这里有代码重用。使用而不是执行更少的检查,matrix*matrix需要额外的函数调用。因此,使用的好处matrix是纯粹的语法,而不是更好的性能。
unutbu

4 * 1 + 3 * 3在您执行np.dot(c,d)时给您13,实际上不是数学上的叉积
PirateApp

92

Scipy.org建议您使用数组:

*'array'或'matrix'?我应该使用哪个?-简短答案

使用数组。

  • 它们是numpy的标准向量/矩阵/张量类型。许多numpy函数返回数组,而不是矩阵。

  • 在逐元素运算和线性代数运算之间有明显的区别。

  • 如果愿意,可以有标准向量或行/列向量。

使用数组类型的唯一缺点是,您将不得不使用dot而不是*乘(减少)两个张量(标量积,矩阵向量乘法等)。


11
即使接受的答案提供了更多信息,但真正的答案确实是坚持不变的ndarray。使用的主要参数matrix是,如果您的代码在线性代数中比较繁琐,并且对dot函数的所有调用看起来都不那么清晰。但是,既然将@ -operator用于矩阵乘法,该论点将在将来消失,请参阅PEP 465。这将需要Python 3.5和最新版本的Numpy。矩阵类可能在不远的将来被弃用,因此最好将ndarray用于新代码...
Bas Swinckels 2015年

6
该页面友好地忘记了scipy.sparse矩阵。如果您在代码中同时使用了密集和稀疏矩阵,则坚持起来会容易得多matrix
David Nemeskey '16

3
在我看来,数组的主要缺点是列切片会返回平面数组,这可能会造成混淆,并且在数学上并不真正合理。这也导致了一个重要的缺点,即无法以scipy.sparse矩阵的相同方式来处理numpy数组,而numpy矩阵基本上可以与稀疏矩阵自由交换。scipy建议在这种情况下使用数组有点荒唐,然后不提供兼容的稀疏数组。
无线电控制的

29

只是将一个案例添加到unutbu的列表中。

与numpy矩阵或矩阵语言(如matlab)相比,numpy ndarray对我而言最大的实际差异之一是,在归约运算中未保留维。矩阵始终为2d,而数组的均值则少一维。

例如,矩阵或数组的行为不佳的行:

带矩阵

>>> m = np.mat([[1,2],[2,3]])
>>> m
matrix([[1, 2],
        [2, 3]])
>>> mm = m.mean(1)
>>> mm
matrix([[ 1.5],
        [ 2.5]])
>>> mm.shape
(2, 1)
>>> m - mm
matrix([[-0.5,  0.5],
        [-0.5,  0.5]])

带阵列

>>> a = np.array([[1,2],[2,3]])
>>> a
array([[1, 2],
       [2, 3]])
>>> am = a.mean(1)
>>> am.shape
(2,)
>>> am
array([ 1.5,  2.5])
>>> a - am #wrong
array([[-0.5, -0.5],
       [ 0.5,  0.5]])
>>> a - am[:, np.newaxis]  #right
array([[-0.5,  0.5],
       [-0.5,  0.5]])

我还认为混合数组和矩阵会带来很多“快乐的”调试时间。但是,就乘法而言,scipy.sparse矩阵始终是矩阵。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.