许多统计教科书提供了一个直观的说明协方差矩阵的特征向量是:
向量u和z形成本征向量(本征轴)。这是有道理的。但是令我困惑的一件事是,我们从相关矩阵中提取特征向量,而不是原始数据。此外,完全不同的原始数据集可以具有相同的相关矩阵。例如,以下两个都具有以下相关矩阵:
因此,它们的特征向量指向相同的方向:
但是,如果对特征向量在原始数据中的哪个方向应用相同的视觉解释,则会得到指向不同方向的向量。
有人可以告诉我我哪里出问题了吗?
第二次编辑:如果我这么大胆,下面给出了出色的答案,我就能够弄清混乱并作了说明。
视觉解释与以下事实相吻合:从协方差矩阵提取的特征向量是不同的。
协方差和特征向量(红色):
协方差和特征向量(蓝色):
相关矩阵反映了标准化变量的协方差矩阵。目视检查标准变量表明了为什么在我的示例中提取相同的特征向量:
3
如果要评估相关性,则必须使用比例绘制散点图,其中各个分量的标准偏差相等。在您的任何图像中都不是这种情况(第二幅图像中的红点除外),这可能是您感到困惑的原因之一。
—
ub
感谢您阐明了您的问题。这可以帮助人们理解它,并增加线程的价值以供将来参考。但是要注意,约10%的男人是红绿色色盲。有2种颜色,红色和蓝色可能更安全。
—
gung-恢复莫妮卡
非常感谢,我已按照您的建议纠正了颜色
—
Sue Doh Nimh 2014年
没问题,@ SueDohNimh。感谢您让所有人理解。另一方面,我会保留
—
gung-恢复莫妮卡
[PCA]
标签。如果您想重新关注该问题,或者提出一个新的(相关的)问题并链接到该问题,这似乎很好,但是我认为这个问题对PCA来说足够值得标记。
干得好,@ SueDohNimh。如果愿意,也可以将其添加为您自己的问题的答案,而不是进行编辑。
—
gung-恢复莫妮卡