两个相同数据集之间的CCA是否等于该数据集上的PCA?


9

阅读有关两个随机向量和规范相关分析(CCA)的维基百科,我想知道当时主成分分析(PCA)是否与CCA相同?XYX=Y


请更清楚地说明:1)vectors X and Y是两个变量(数据列)还是两个案例(行)?鉴于我们将执行变量分析。2)X and Y are the same您是否想说X = Y或其他方式?
ttnphns

@ttnphns:1) XY是两个随机向量。它们是随机变量的两个向量,两组数据列,而不是两种情况(行)。2)X=ÿ
2013年

如果每个集合都由一个变量组成,则存在一个正则相关,正好是它们之间的Pearson r。CCA变成X通过Y线性回归,反之亦然。通过PCA 分解r则是另一回事了。PCA和CCA是不同的分析。
ttnphns 2013年

嗨,@ Tim,我想知道我的回答是否有用,或者您是否还有其他疑问?如果是这样,我很乐意澄清。
amoeba 2014年

@amoeba:是的。我现在没有其他问题了,稍后将阅读您的回复。感谢您的回复。+ 1
蒂姆(Tim)

Answers:


6

Xn×p1Yn×p2 数据矩阵,代表两个数据集 n 样本(即对随机行向量的观察 XY)。

CCA寻找以下各项的线性组合 p1 变量 X 以及 p2 变量 Y使它们彼此之间最大相关;然后在与第一对零相关的约束下寻找下一对;等等

如果 X=Y (和 p1=p2=p),一个数据集中的任何线性组合都将具有相关性 1在另一个数据集中具有相同的线性组合。因此,所有CCA对都将具有相关性1,对的顺序是任意的。唯一剩下的约束是线性组合之间应该互不相关。有无数种选择方式p不相关的线性组合(注意,权重也并不一定要在正交p维空间),它们中的任何一个都会产生有效的CCA解决方案。PCA确实给出了一种这样的方式,因为任何两个PC的相关性均为零。

因此,PCA解决方案确实将是有效的CCA解决方案,但是在这种情况下,存在无数个等效的CCA解决方案。


从数学上讲,CCA寻找正确的(a) 走了 (b)的奇异向量 CXX1/2CXYCYY1/2,在这种情况下等于 I,其中任何向量都是本征向量。所以a=b可以是任意的。然后,CCA获得线性组合权重为CXX1/2aCYY1/2b。在这种情况下,它归结为一个任意的基础并用CXX1/2,这确实会产生不相关的方向

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.