Answers:
基本上,将因子得分计算为由因子负载加权的原始响应。因此,您需要查看第一个维度的因子负载,以了解每个变量与主成分的关系。观察到与特定变量相关的高正(负)负载意味着这些变量对该组件有正(负)贡献。因此,在这些变量上得分高的人在该特定维度上倾向于获得较高(而较低)的因子得分。
绘制相关圆有助于大致了解对第一个主轴“正”与“负”(如果有)的变量,但是如果您使用R,则可以看看FactoMineR包和该dimdesc()
功能。
这是USArrests
数据示例:
> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1) # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
correlation p.value
Assault 0.918 5.76e-21
Rape 0.856 2.40e-15
Murder 0.844 1.39e-14
UrbanPop 0.438 1.46e-03
> res$var$coord # show loadings associated to each axis
Dim.1 Dim.2 Dim.3 Dim.4
Murder 0.844 -0.416 0.204 0.2704
Assault 0.918 -0.187 0.160 -0.3096
UrbanPop 0.438 0.868 0.226 0.0558
Rape 0.856 0.166 -0.488 0.0371
从最新结果可以看出,第一维度主要反映了暴力行为(任何形式)。如果我们查看单个地图,则很明显,位于右侧的州是此类行为最频繁的州。
您可能对以下相关问题也感兴趣:什么是主成分分数?
对我来说,PCA分数只是对数据的重新排列,其形式使我可以用更少的变量来解释数据集。分数代表每个项目与组件的相关程度。您可以按因子分析来命名它们,但是要记住它们不是潜在变量,因为PCA会分析数据集中的所有差异,而不仅是共有的元素(因子分析也是如此),这一点很重要。
PCA结果(不同维度或组成部分)通常不能转换为真实的概念,我认为假设其中一个成分是“恐惧熊”是错误的,导致您认为该成分是什么意思?主成分过程将您的数据矩阵转换为具有相同或更少维数的新数据矩阵,并且所得维数的范围从可以更好地解释方差的维度到到可以解释得较少的维度。基于原始变量与计算出的特征向量的组合来计算该分量。总体PCA程序确实会将原始变量转换为正交变量(线性独立)。希望这可以帮助您澄清有关pca程序的信息