PCA解决方案是否独特?


12

在某些数据集上运行PCA时,给我的解决方案是否唯一?

即,我根据点间距离获得了一组二维坐标。是否有可能找到满足这些约束的至少另一种点排列方式?

如果答案是肯定的,我如何找到这种不同的解决方案?


11
唯一性问题的答案是肯定和否定。在特征空间和特征值在数学上很好且唯一定义的意义上,它是“是”。从某种意义上说“否”:(a)有多种方式表示这些本征空间(甚至可以对归一化的本征向量进行求反,并且退化本征空间的依据有很多选择),并且(b)不同的算法可能会产生不同的结果由于在计算中累积了浮点误差。
ub

Ramsay和Silverman在《 Functinal Data Analysis》一书中提到了VARIMAX旋转。关于将功能数据集(以矩阵表示)拆分为其主要组成部分的讨论。
电源

听起来您想使用PCA作为减少尺寸的工具。您可以先查看
Elvis

Answers:


7

不,答案不是唯一的。有很多方法可以证明这一点。一种可能性是注意到p矩阵X 平方的谱分解是w的凸函数最大化的解。考虑第一个特征向量/值:ppXw

λ1=maxwRp:||w||=1wXw

(其中是第一个特征值,是第一个特征向量)。w ^ *λ1w

通常,解决此类问题的方法(例如达到最大的的值)并不是唯一的。w

但是,用于计算这些解决方案的算法是确定性的,这意味着除了数字极端情况外,您获得的解决方案应该相同。

此类数字拐角情况的示例:几个特征值(数字上)相同的情况,秩不足的情况...X


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.