在主成分分析中,前主成分是具有最大方差的正交方向。换句话说,选择第一主成分为最大方差的方向,选择第二主成分为与最大方差正交的方向,依此类推。ķ
因子分析有类似的解释吗?例如,我认为前因子是最能解释原始相关矩阵的非对角分量的因子(例如,原始相关矩阵与由相关系数定义的相关矩阵之间的平方误差)因素)。这是真的吗(或者我们可以说类似的话)?
在主成分分析中,前主成分是具有最大方差的正交方向。换句话说,选择第一主成分为最大方差的方向,选择第二主成分为与最大方差正交的方向,依此类推。ķ
因子分析有类似的解释吗?例如,我认为前因子是最能解释原始相关矩阵的非对角分量的因子(例如,原始相关矩阵与由相关系数定义的相关矩阵之间的平方误差)因素)。这是真的吗(或者我们可以说类似的话)?
Answers:
PCA主要是一种数据缩减技术,其目的是获得数据在较低维空间上的投影。两个等效的目标是迭代最大化方差或最小化重构误差。实际上,在上一个问题的答案中对此进行了详细说明。
相反,因子分析主要是维数据向量的生成模型,称 其中是潜因子的维向量,是且和是不相关错误的向量。的矩阵是的矩阵因子载荷。这产生了协方差矩阵的特殊参数化,如 。此模型的问题在于参数化过度。如果替换为则会获得相同的模型X X = A S + ϵ
因此,为了回答这个问题,使用因子分析模型不会自动给出所选因子,因此对第一个因子没有单一的解释。您必须指定用于估计的列空间的方法和用于选择旋转的方法。如果(所有误差均具有相同的方差),则的列空间的MLE解为前导主成分向量所跨越的空间,这可以通过奇异值分解找到。当然,可以选择不旋转并报告这些主成分矢量作为因素。 甲d = σ 2我甲q
编辑:为了强调我的看法,因子分析模型是协方差矩阵的模型,作为秩矩阵和对角矩阵。因此,该模型的目的是最好地解释协方差矩阵上具有这种结构的协方差。解释是协方差矩阵上的这种结构与未观察到的维因子兼容。不幸的是,这些因素不能唯一地恢复,并且如何在一组可能的因素中选择它们与数据的解释没有任何关系。与PCA一样,可以预先标准化数据,从而拟合一个模型,该模型试图将相关矩阵解释为秩加对角矩阵。 ķ ķ
@RAEGTIN,我相信您的想法正确。在提取和先前旋转之后,每个连续因子的确会越来越少地发生协变/相关,就像每个连续分量所占的方差越来越小一样:在两种情况下,加载矩阵A的列都以其中的平方元素(载荷)的总和。负荷是相关的bw因子和变量;因此,可以说第一个因素解释了R矩阵中“总体”平方r的最大部分,第二个因素在这里是第二个,依此类推。尽管如此,FA和PCA之间的差异在通过载荷预测相关性时如下:FA被“校准”以还原R仅用m个提取的因子(m个因子<p个变量)就可以很好地完成PCA,而通过m个分量来恢复它是不礼貌的,它需要所有p个分量来无误差地恢复R。
PS只是要添加。在FA中,负载值“包含”干净的社区(负责相关的方差的一部分),而在PCA中,负载是变量的社区和唯一性的混合,因此具有可变性。