我试图了解按以下方式进行的主成分分析的输出:
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
我倾向于从上述输出中得出以下结论:
方差的比例表示特定主成分的方差中有多少总方差。因此,PC1变异性解释了数据总变异的73%。
显示的旋转值与某些说明中提到的“载荷”相同。
考虑到PC1的旋转,可以得出以下结论:Sepal.Length,Petal.Length和Petal.Width是直接相关的,并且它们都与Sepal.Width成反比(在PC1的旋转中负值)
植物中可能存在一个因素(某些化学/物理功能系统等)可能会影响所有这些变量(一个方向上的Sepal.Length,Petal.Length和Petal.Width以及相反方向的Sepal.Width)。
如果要在一张图中显示所有旋转,则可以通过将每个旋转乘以该主成分的方差比例来显示它们对总变化的相对贡献。例如,对于PC1,旋转的0.52,-0.26、0.58和0.56都乘以0.73(PC1的比例方差,显示在summary(res)输出中。
我对上述结论正确吗?
关于问题5的编辑:我想在一个简单的条形图中显示所有旋转,如下所示:
由于PC2,PC3和PC4对变化的贡献逐渐减小,因此调整(减少)那里变量的负载是否有意义?
关于(5):您所谓的“载荷”实际上不是载荷,而是协方差矩阵的特征向量,也就是主轴方向,又是主轴。“载荷”是特征向量乘以其特征值的平方根,即乘以解释方差比例的平方根。加载具有许多不错的属性,并且对于解释很有用,请参见例如以下线程:PCA中的加载vs本征向量:何时使用一个或另一个?因此,是的,仅使用已解释方差的平方根来缩放特征向量就很有意义。
—
变形虫2015年
@amoeba:在PCA,旋转或荷载的双线图中绘制了什么?
—
rnso 2015年