关于PCA术后斜转


9

几个统计软件包(例如SAS,SPSS和R)使您可以在PCA之后执行某种因子轮换。

  1. 为什么要在PCA之后进行轮换?
  2. 考虑到PCA的目的是产生正交尺寸,为什么要在PCA之后进行倾斜旋转?

我问了一个问题,该问题说明了PCA后需要进行因子旋转的原因,因为PCA给出了有偏差的结果。见stats.stackexchange.com/questions/6575/...
mbaitoff

Answers:


8

我认为对PCA有不同的意见或看法,但基本上,我们经常将其视为一种缩减技术(将特征空间缩减为较小的空间,通常更“易读”,前提是您要适当地居中/标准化)。数据(如果需要)或构建潜在因素的方法或构成个体间差异很大一部分的维度(此处,“个体”代表收集数据的统计单位;可能是国家,人等)。在这两种情况下,我们都要构造原始变量的线性组合,这些线性组合要考虑方差的最大值(当投影在主轴上时),这要受任何两个主要分量之间的正交性约束。现在,所描述的纯粹是代数的或数学的,我们不认为它是一个(生成的)模型,这与因子分析传统中所做的相反,在传统的因子分析中,我们加入了一个误差项来解释某种测量误差。我也喜欢William Revelle在即将出版的有关使用R的应用心理学计量学手册中的介绍。 (第6章),如果我们要分析相关矩阵的结构,则

第一个[方法,PCA]是一个根据分量乘积近似相关矩阵的模型,其中每个分量都是变量的加权线性和,第二个模型[因子分析]也是相关矩阵的近似这是两个因素的乘积,但其中的因素被视为变量的原因而不是结果。

换句话说,对于PCA,您将每个组件(因子)表示为变量的线性组合,而在FA中,这些是表示为因子的线性组合的变量。众所周知,这两种方法通常会产生非常相似的结果(例如,参见Harman,1976或Catell,1978),尤其是在“理想”情况下,我们有大量的个体和良好的比率因子:变量(通常变化)在2到10之间,具体取决于您考虑的作者!)。这是因为,通过估计相关矩阵中的对角线(就像在FA中所做的那样,并且这些元素称为社区),可以从因子矩阵中消除误差方差。这就是为什么PCA经常被用来代替上个世纪开发的FA来揭示潜在因素或心理构造的原因。但是,当我们沿着这种方式前进时,我们通常希望对结果因子结构(或所谓的模式矩阵)进行更简单的解释。然后是旋转阶乘轴的有用技巧,以便我们最大化特定因数上变量的负载,或等效地达到“简单结构”。使用正交旋转(例如VARIMAX),我们保留了因子的独立性。通过倾斜旋转(例如OBLIMIN,PROMAX),我们将其破坏,并且允许相关系数。这在文献中已引起很大争议,并导致了一些作者(不是心理学家,而是1960年代初期的统计学家。

但关键是轮换方法最初是在FA方法的背景下开发的,现在已与PCA常规使用。我不认为这与主成分的算法计算相矛盾:只要记住,一旦关联(通过倾斜旋转),阶乘空间的解释就变得不那么明显了,您可以按照自己想要的方式旋转阶乘轴。

在开发新调查表时通常使用PCA,尽管在这种情况下FA可能是一种更好的方法,因为我们试图提取有意义的因素,这些因素应考虑到测量误差并可能自行研究其关系(例如,通过排除结果模式)矩阵,我们得到一个二阶因子模型)。但是PCA也用于检查已经验证的因子结构。研究人员说,研究人员对FA与PCA的关系并不重要,他们说500名具有代表性的受试者需要对60项问卷进行评分,以解决5个维度(NEO-FFI就是这种情况)(例如),我认为它们是正确的,因为在这种情况下,我们对识别生成模型或概念模型的兴趣不大(此处使用“代表”一词来缓解度量不变性问题)。

现在,关于旋转方法的选择以及为什么有些作者反对严格使用正交旋转,我想引用Paul Kline,就像我回答以下问题FA:基于“简单结构”选择旋转矩阵一样。条件”

(...)在现实世界中,认为作为重要的行为决定因素的因素会相互关联并非没有道理。-P. Kline, 情报。心理计量学观点,1991,p。19

因此,我会得出结论,根据您的研究目标(您想突出显示相关矩阵的主要模式,还是寻求对可能导致您观察到这种相关矩阵的潜在机制进行明智的解释? ),您可以选择最合适的方法:这与线性组合的构建无关,而只是在您想要解释结果阶乘空间的方式上。

参考文献

  1. Harman,HH(1976)。现代因素分析。芝加哥,芝加哥大学出版社。
  2. 卡特尔(Cattell),RB(1978)。因子分析的科学应用。纽约,全体会议。
  3. 克莱恩(1991)。情报。心理测量学观点。Routledge。

4

正交尺寸的问题在于组件可能无法解释。因此,尽管倾斜旋转(即,非正交尺寸)在技术上不太令人满意,但是这种旋转有时会增强所得组件的可解释性。


4

基本要点

  • 旋转可以使组件的解释更清晰
  • 倾斜旋转通常具有更多的理论意义。即,可以根据较少数量的相关分量来解释观察到的变量。

  • 10个测试所有的测量能力都带有一些测量语言和一些测量空间能力。所有测试都是相互关联的,但口头或空间测试中的相互关系要比跨测试类型的相互关系大。简约的PCA可能涉及两个相关的组件:语言和空间。理论和研究表明这两种能力是相关的。因此,倾斜旋转具有理论意义。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.