神经网络文献中的张量:那里最简单的定义是什么?


16

在神经网络文献中,经常遇到“张量”一词。

它与向量不同吗?从矩阵?您是否有任何具体示例可以阐明其定义?

我对它的定义有些困惑。维基百科无济于事,有时我的印象是,它的定义取决于所使用的特定机器学习环境(TensorFlow,Caffee,Theano)。


Answers:


12

出于数据分析的目的,您可以有效地将它们视为数组,可能是多维数组。因此,它们包括标量,向量,矩阵以及所有更高阶的数组。

精确的数学定义更为复杂。从根本上说,张量将多线性函数转换为线性函数。参见(1)(2)。(多线性函数是在其每个分量中都是线性的函数,其中一个示例是被视为列向量的函数的行列式。)

定义张量的这种数学属性的一个结果是,张量相对于Jacobian进行了很好的转换,后者对从一个坐标系到另一个坐标系的转换进行编码。这就是为什么人们经常将张量的定义视为物理学中“在坐标变化下以某种方式转换的对象”。例如观看此视频,或者这一个

如果我们要处理足够“好”的对象(我们希望存在且定义明确的所有派生对象),那么所有这些关于张量的思考方式基本上都是等效的。请注意,我提到的第一个思考张量的方法(多维数组)忽略了协变张量和逆变张量之间的区别。(区别在于它们的系数在基础向量空间的基础上发生变化,即本质上在行向量和列向量之间如何变化。)请参阅以下其他StackExchange问​​题:(1) (2) (3) (4)

对于研究张量在神经网络中的应用的研究人员所用的书(例如,在以色列的Technion上),有沃尔夫冈·哈克布施(Wolfgang Hackbusch)的张量空间和数值微积分。我本人还没有读过它,尽管后面的某些章节似乎使用了高级数学。


3
+1。非常相关:stats.stackexchange.com/a/198395/28666。在我看来,在机器学习中,张量只是数组而已。在数学中,张量的理解不同。通常,“张量”一词的使用范围比“张量积的元素”更狭义。请参阅链接的答案。
变形虫说恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.