Answers:
几何学上,矩阵称为的矩阵的标量积(=点积,=内积)。在代数上,它称为平方和和乘积矩阵(SSCP)。
它的第个对角元素等于∑ a 2 (i ),其中a (i )表示A的第i列中的值,而∑是各行之和。其中的第i j个非对角元素为∑ a (i ) a (j )。
有许多重要的关联系数,它们的平方矩阵称为角度相似度或SSCP类型相似度:
将SSCP矩阵除以,即样本大小或A的行数,即可得到MSCP(均方和叉积)矩阵。因此,该关联度量的成对公式为∑ x y(向量x和y是A的一对列)。
如果您居中的列(变量),然后一个'一是散射(或共同分散,如果是严格)基质和是协方差矩阵。协方差的成对公式为∑ c x c y其中cx和cy表示中心列。
如果z- 标准化A的列(减去列的平均值和通过标准偏差除),然后是皮尔森相关矩阵:相关性是标准化变量的协方差。成对的相关公式为∑ z x z y,zx和zy表示标准化列。该相关也称为线性系数。
如果您单位标度A的列(把他们的SS,求和的平方为1),然后是余弦相似矩阵。因此,等效的成对公式似乎是∑ u x u y = ∑ x y其中ux和uy表示L2归一化列。余弦相似度也称为比例系数。
如果居中然后单位- 规模的列,然后甲'甲再次是皮尔森相关矩阵,因为相关性是居中变量余弦1 ,2:
除了这些四个主要的关联措施,也让我们提一些其他的,也是基于,最糟糕的是。可以将它们视为余弦相似度的替代方法,因为它们采用与归一化不同的公式,即公式中的分母:
同一性系数[Zegers&Ten Berge,1985]的分母为算术平均值而不是几何平均值:。当且仅当A的被比较列相同时,才可以为1。
另一个类似的可用系数称为相似比:。
最后,如果中的值是非负值,并且它们在列中的总和为1(例如,它们是比例),则√是保真度或Bhattacharyya系数的矩阵。
还一种方法来计算相关或协方差矩阵,由许多统计软件包使用的,绕过定心的数据,并直接从SSCP矩阵离开甲'阿这种方式。令 s为数据 A的列总和的行向量,而 n为数据中的行数。然后(1)计算所述散布矩阵为 C ^ = 甲'甲- 小号'小号/ Ñ [那里, Ç /(ñ - 1 )将协方差矩阵]; (2) C的对角线是行向量的平方偏差之和; (3)计算相关矩阵R = C / √。
一位敏锐但统计上新手的读者可能会发现很难调和两个相关的定义,即“协方差”(包括按样本量平均,除以df=“ n-1”)和“余弦”(表示无这样的平均值)。但是实际上,在相关的第一个公式中没有真正的平均发生。事情是那圣。依次通过除以相同的df来计算达到z标准化的偏差;因此,如果解开该公式,则相关协方差公式中的分母“ n-1”将完全抵消:该公式变为余弦公式。要计算你真的需要经验的相关值不知道 ñ (除非计算平均值,否则要居中)。
的几何形状的一个重要观点是这样(在斯特朗的书的“线性代数及其应用”的观点出发,强烈强调):假设A是米× Ñ等级为k的-矩阵,表示线性地图 甲:- [R ñ → ř 米。让上校(A)和行(A)是列和行空间一个。然后
(a)作为一个实对称矩阵,具有基础 { ë 1,。。。,ê Ñ }非零特征值的特征向量的 ð 1,... ,d ķ。从而:
。
(b)根据Col(A)的定义,范围(A)= Col(A)。因此,A | Row(A)将Row(A)映射到Col(A)。
(c)内核(A)是行(A)的正交补码。这是因为矩阵乘法是根据点积(行i)*(col j)定义的。(因此
(d)和 A | Row(A):Row(A)→ C o l (A )是同构的。
Reason: If v = r+k (r \in Row(A), k \in Kernel(A),from (c)) then
A(v) = A(r) + 0 = A(r) where A(r) = 0 <==> r = 0$.
[偶然提供了行等级=列等级的证明!]
(e)申请(d), 是同构
(f)将(d)和(e):和A'A地图行(A)同构到行(A)。
尽管已经讨论过具有取点积的含义,但我只会添加这种乘法的图形表示。
事实上,尽管矩阵的行(和矩阵的列)表示变量,我们将每个变量测量值作为一个多维矢量。乘以行的与列的相当于服用两个向量的点积: -结果是所述条目在位置在矩阵。
类似地,行乘以的与列的等同于点积:,结果在位置。
所得矩阵A T A的项的含义是向量r o w p在向量c o l k的方向上有多少。如果两个向量r o w i和c o l j的点积不为零,则有关向量r o w i的一些信息被携带通过载体,反之亦然。
这个想法在主成分分析中起着重要的作用,我们想要找到初始数据矩阵的新表示形式,这样就不会在任何其他列j中携带任何有关列更多信息。。深入研究PCA,您会发现计算出了协方差矩阵的“新版本”,它变成了对角矩阵,我留给您意识到……确实意味着我在前一句话中所表达的。