如何使用主成分分析来白化数据?


18

我想将数据转换为使得方差将为1而协方差将为零(即,我想白化数据)。此外,均值应为零。X

我知道我将通过Z标准化和PCA转换达到目标,但是我应该按什么顺序进行?

我应该补充一点,组成的美白转换应采用。xWx+b

有没有一种类似于PCA的方法,可以完全完成这两个转换并给出上面形式的公式?


(我的第一条评论是基于对您的问题的误读。)PCA使您的协方差为零;您可以根据需要对PC进行标准化。听起来很奇怪,但是您可以做到。
尼克·考克斯

@NickCox也许看起来很奇怪,因为转换后的数据是球形的,这似乎毫无意义。但是,这是我需要知道的转换,而不是最终结果。我仍然不知道转换会是什么样子。不过,我仍在阅读PCA。
Angelorf 2014年

Answers:


31

首先,通过减去平均值获得平均值零μ=1Nx

其次,通过执行PCA,将协方差设为零。如果是数据的协方差矩阵,则PCA等于执行本征分解,其中为由特征向量和特征向量组成的正交旋转矩阵是对角矩阵,其特征值在对角线上。矩阵给出旋转以解相关数据(即,将原始特征映射到主要成分)。ΣΣ=UΛUUΣΛU

第三,旋转之后,每个分量将具有由相应特征值给出的方差。因此,要使方差等于,您需要除以平方根。1Λ

总之,美白转换是。您可以打开方括号以获取所需的表格。xΛ1/2U(xμ)


更新。另请参阅此后续线程以了解更多详细信息:ZCA美白和PCA美白之间有什么区别?


2
我认为您需要除以特征值的平方根,因为这是通过SD进行缩放的问题,而不是方差。
尼克·考克斯

@NickCox:是的,你当然是对的。我更正了我的答案。谢谢!
变形虫说恢复莫妮卡

1
我已经通过经验验证了该公式。感谢您的帮助!
Angelorf
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.