关于PCA,我有几个快速问题:
- PCA是否假定数据集是高斯的?
- 当我将PCA应用于固有的非线性数据时会发生什么?
对于给定的数据集,过程是首先进行均值归一化,将方差设置为1,采用SVD,降低等级,最后将数据集映射到新的降低等级的空间中。在新空间中,每个维度都对应于最大方差的“方向”。
- 但是,在新空间中该数据集的相关性是否始终为零,还是仅对本质上为高斯的数据适用?
假设我有两个数据集“ A”和“ B”,其中“ A”对应于从高斯获得的随机采样点,而“ B”对应于从另一分布中随机采样的点(例如Poisson)。
- PCA(A)与PCA(B)相比如何?
- 通过查看新空间中的点,我如何确定PCA(A)对应于从高斯采样的点,而PCA(B)对应于从泊松采样的点?
- “ A”中的点的相关性是否为0?
- “ B”中的点的相关性也为0吗?
- 更重要的是,我要问“正确”的问题吗?
- 我应该看看相关性,还是应该考虑另一个指标?