这个问题主要与PCA / FA的定义有关,因此意见可能会有所不同。我的观点是,不应将PCA + varimax称为PCA或FA,而应将bur明确地称为“旋转varimax的PCA”。
我应该补充一点,这是一个令人困惑的话题。在这个答案中,我想解释一下轮换实际上是什么;这将需要一些数学。随便的读者可以直接跳到插图。只有这样,我们才能讨论PCA +旋转是否应该被称为“ PCA”。
一个参考是Jolliffe的书“主成分分析”的第11.1节“主成分的旋转”,但是我发现它可能更清晰。
令为一个数据矩阵,我们假设它是居中的。PCA量(在这里看到我的答案)的奇异值分解:。关于此分解,有两个等效但互补的视图:一个更加PCA风格的“投影”视图和一个更加FA风格的“潜在变量”视图。 Ñ × p X = û 小号V ⊤Xn×pX=USV⊤
根据PCA样式的观点,我们发现了一堆正交方向(这些是协方差矩阵的特征向量,也称为“主要方向”或“轴”)和“主要成分”(也称为主成分“得分”)是这些方向上的数据投影。主成分是不相关的,第一个成分具有最大可能的方差,等等。我们可以这样写:Ù 小号X = û 小号 ⋅ V ⊤ = 比分⋅ 主方向。VUS
X=US⋅V⊤=Scores⋅Principal directions.
根据FA风格的观点,我们发现了一些不相关的单位方差“潜在因素”,这些因素通过“负荷”产生了观察到的变量。实际上,是标准化的主成分(不相关且具有单位方差),如果我们将载荷定义为,然后 (请注意。)这两个视图是等效的。请注意,加载是按各自特征值缩放的特征向量(是协方差矩阵的特征值)。L=VS/ √U˜=n−1−−−−−√U X= √L=VS/n−1−−−−−√小号 ⊤=小号小号/ √
X=n−1−−−−−√U⋅(VS/n−1−−−−−√)⊤=U˜⋅L⊤=Standardized scores⋅Loadings.
S⊤=SS/n−1−−−−−√
(我应该在括号中加上PCA FA≠; FA明确旨在寻找通过载荷线性映射到观测变量的潜在因子;它比PCA更加灵活,并且产生不同的载荷。这就是为什么我更喜欢将其称为尽管有些人将其视为FA方法之一,但它不是FA,而是“ PCA上的FA样式视图”。)
现在,轮换是做什么的?例如正交旋转,例如varimax。首先,它仅考虑分量,即:然后,它取一个平方正交矩阵,并将插入此分解中:其中旋转载荷由X ≈ ù ķ 小号 ķ V ⊤ ķ = 〜Ü ķ 大号⊤ ķ。ķ × ķ Ť Ť Ť ⊤ = 我X ≈ ù ķ 小号 ķ V ⊤ ķ = û ķ Ť Ť ⊤ 小号 ķ V ⊤ ķ = 〜ü ř ö 吨大号⊤ ř Ò 吨,k<p
X≈UkSkV⊤k=U˜kL⊤k.
k×kTTT⊤=IX≈UkSkV⊤k=UkTT⊤SkV⊤k=U˜rotL⊤rot,
〜ü ř ö 吨 =〜Ü ķ Ť Ť 大号ř ö 吨Lrot=LkT,旋转标准分数由。(这样做的目的是找到,以使变得尽可能接近稀疏,以便于解释。)
U˜rot=U˜kTTLrot
注意旋转的是:(1)标准化分数,(2)加载。但不是原始分数,也不是主要方向!因此,旋转发生在潜在空间中,而不是原始空间中。这绝对至关重要。
从FA风格的角度来看,什么也没发生。(A)潜在因素仍然是不相关和标准化的。(B)它们仍然通过(旋转)载荷映射到观测变量。(C)每个组件/因子捕获的方差量由相应加载列的平方值之和得出。(D)在几何上,载荷仍然跨越的相同维子空间(该子空间由前 PCA特征向量跨越)。(E)的近似值和重构误差完全没有变化。(F)协方差矩阵仍然近似相等: k R p k XLrotkRpkX
Σ≈LkL⊤k=LrotL⊤rot.
但是PCA风格的观点实际上已经崩溃。旋转的负载不再与正交方向/轴相对应,即的列不正交!更糟糕的是,如果您[正交]将数据投影到旋转载荷指定的方向上,则会得到相关的投影(!),并且将无法恢复得分。[相反,要计算旋转后的标准分数,需要将数据矩阵与载荷的伪逆相乘。或者,您可以使用旋转矩阵简单地旋转原始的标准分数:RpLrotU˜rot=X(L+rot)⊤U˜rot=U˜T ]此外,旋转的分量不会连续捕获最大方差量:方差会在各个分量之间重新分配(甚至尽管所有旋转分量捕获的方差与所有原始主分量捕获的正好一样大)。kk
这是一个例子。数据是沿主对角线拉伸的2D椭圆。第一个主方向是主对角线,第二个主方向与之正交。PCA加载向量(由特征值缩放的特征向量)以红色显示-指向两个方向,并且也被恒定的可见性因子拉伸。然后,我对荷载施加了的正交旋转。生成的加载向量以洋红色显示。请注意它们如何不正交(!)。30∘
一个FA风格的直觉如下:想象一个“潜在空间”,其中的点填充一个小圆圈(来自具有单位方差的2D高斯)。然后,这些点的分布沿PCA载荷(红色)拉伸,成为我们在该图上看到的数据椭圆。但是,可以旋转相同的点分布,然后沿着旋转的PCA载荷(洋红色)拉伸它们,以变为相同的数据椭圆形。
[实际上要看到载荷的正交旋转是旋转,所以需要查看PCA双线图。在那里,对应于原始变量的矢量/射线将简单地旋转。]
让我们总结一下。在正交旋转(例如varimax)之后,“旋转主”轴不正交,并且在它们上的正交投影没有意义。因此,应该宁愿放弃整个轴/投影的观点。仍然称其为PCA(这全是关于具有最大方差等的投影)会很奇怪。
从FA风格的角度来看,我们只是简单地旋转了(标准的和不相关的)潜在因素,这是有效的操作。FA中没有“投影”;相反,潜在因子通过载荷生成观察到的变量。此逻辑仍然保留。但是,我们从主要成分开始,这些成分实际上并不是因素(因为PCA与FA不同)。因此,也将其称为FA是很奇怪的。
我建议您谨慎地指定确切使用的过程:“ PCA后跟varimax旋转”,而不是争论一个“应该”应该称为PCA还是FA。
后记。它是可以考虑的替代旋转过程,其中插入之间和。这将旋转原始分数和特征向量(而不是标准化分数和负荷)。这种方法的最大问题是,经过这样的“轮换”之后,分数将不再不相关,这对于PCA来说是致命的。一个能做到这一点,但它不是如何轮换通常被理解和应用。TT⊤USV⊤