如何将numpy.linalg.norm应用于矩阵的每一行?


80

我有一个2D矩阵,我想对每一行进行规范。但是当我numpy.linalg.norm(X)直接使用时,它将采用整个矩阵的范数。

我可以通过使用for循环来对每一行进行规范,然后对每一行进行规范X[i],但是由于我有30k行,所以这需要花费大量时间。

有什么建议可以找到更快的方法吗?还是可以将其应用于np.linalg.norm矩阵的每一行?

Answers:


86

请注意,如perimosocordiae所示,从NumPy 1.9版本开始,这np.linalg.norm(x, axis=1)是计算L2-范数的最快方法。


如果要计算L2范数,则可以直接计算(使用自axis=-1变量沿行求和):

np.sum(np.abs(x)**2,axis=-1)**(1./2)

Lp-范数当然可以类似地计算。

它的速度比快得多np.apply_along_axis,尽管可能不那么方便:

In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop

In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop

其他ord形式的norm也可以直接计算(具有类似的加速比):

In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop

In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop

8
如果仍然对x求平方,为什么还要执行np.abs(x)?
Patrick

10
@帕特里克:如果的dtypex是复数,则会有所不同。例如,如果x = np.array([(1+1j,2+1j)])thennp.sum(np.abs(x)**2,axis=-1)**(1./2)array([ 2.64575131]),而np.sum(x**2,axis=-1)**(1./2)is是array([ 2.20320266+1.36165413j])
unutbu 2013年

3
@perimosocordiae发布了一个更新,numpy.linalg.norm其中使用 axis参数是当前最快的方法。
Ioannis Filippidis

如果要对矩阵按列进行规范,该怎么做?
Gunjan naik 2015年

@ user3515225 :np.linalg.norm(x, axis=0)。所述axis指所求和的轴线。对于2D数组,0轴指向行,因此axis=0导致norm对每个固定列的行求和。
unutbu 2015年

52

由于numpy更新而复活了一个旧问题。从1.9版本开始,numpy.linalg.norm现在接受一个axis参数。[代码文档]

这是镇上最快的新方法:

In [10]: x = np.random.random((500,500))

In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop

In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop

In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop

并证明它正在计算同一件事:

In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True

15

比接受的答案快得多

numpy.sqrt(numpy.einsum('ij,ij->i', a, a))

注意对数刻度:

在此处输入图片说明


复制剧情的代码:

import numpy
import perfplot


def sum_sqrt(a):
    return numpy.sqrt(numpy.sum(numpy.abs(a)**2, axis=-1))


def apply_norm_along_axis(a):
    return numpy.apply_along_axis(numpy.linalg.norm, 1, a)


def norm_axis(a):
    return numpy.linalg.norm(a, axis=1)


def einsum_sqrt(a):
    return numpy.sqrt(numpy.einsum('ij,ij->i', a, a))


perfplot.show(
    setup=lambda n: numpy.random.rand(n, 3),
    kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
    n_range=[2**k for k in range(20)],
    logx=True,
    logy=True,
    xlabel='len(a)'
    )

2
关心解释是什么吗?
jhin

6

请尝试以下操作:

In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481,  1.41421356,  5.38516481])

a您的2D阵列在哪里。

上面计算了L2范数。对于其他规范,您可以使用类似以下内容的方法:

In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.