为什么主成分分数不相关?


10

假设是均值数据矩阵。矩阵为,具有m个不同的特征值,特征向量\ mathbf s_1\ mathbf s_2 ... \ mathbf s_m正交。S = cov Am × m m s 1 s 2 s m一个小号=冠状病毒一个×s1个s2sm

i个主要成分(有人称其为“分数”)是向量 zi=Asi。换句话说,它是\ mathbf A的列的线性组合A,其中系数是\ mathbf S的第i个特征向量的分量。S

我不明白为什么zizj对于所有i \ neq j都不相关ij。它是否源自sisĴ正交的事实?当然不能,因为我可以轻松地找到矩阵B和一对正交向量x,y从而使BxBy相关。


Answers:


7

zizj=(Asi)(Asj)=siAAsj=(n1)siSsj=(n1)siλjsj=(n1)λjsisj=0。

1
数学:多么美丽的语言。
内斯托尔·

4
这意味着z j是正交的。不相关的装置,这必须为真:ž - ˉ Žž Ĵ - ˉ Ž Ĵ= 0。我想以某种方式ˉ ž = ˉ ž Ĵ = 0,然后ž ž Ĵ = 0也意味着,他们是不相关的。zizj(ziz¯i)(zjz¯j)=0z¯i=z¯j=0zizj=0
欧内斯特A

2
好点,@ Ernest。均值确实为零,因为数据已经以均值为中心(根据您的假设)。然后所有投影的均值必须为零。
变形虫

2
@Jubbles因为,因此=ñ-1小号S=cov(A)=1n1AAAA=(n1)S
欧内斯特A

2
@Ernest,我无法拒绝提供不包含文本的答案,但也许我应该补充一点,PC不相关的根本原因是它们的协方差矩阵由特征向量的给出,并且在此基础上S变成对角线- -这就是特征分解的重点。SS
变形虫2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.