我使用两个不同的函数(prcomp
和)对R进行了主成分分析(PCA),princomp
并观察到PCA分数的符号不同。怎么会这样?
考虑一下:
set.seed(999)
prcomp(data.frame(1:10,rnorm(10)))$x
PC1 PC2
[1,] -4.508620 -0.2567655
[2,] -3.373772 -1.1369417
[3,] -2.679669 1.0903445
[4,] -1.615837 0.7108631
[5,] -0.548879 0.3093389
[6,] 0.481756 0.1639112
[7,] 1.656178 -0.9952875
[8,] 2.560345 -0.2490548
[9,] 3.508442 0.1874520
[10,] 4.520055 0.1761397
set.seed(999)
princomp(data.frame(1:10,rnorm(10)))$scores
Comp.1 Comp.2
[1,] 4.508620 0.2567655
[2,] 3.373772 1.1369417
[3,] 2.679669 -1.0903445
[4,] 1.615837 -0.7108631
[5,] 0.548879 -0.3093389
[6,] -0.481756 -0.1639112
[7,] -1.656178 0.9952875
[8,] -2.560345 0.2490548
[9,] -3.508442 -0.1874520
[10,] -4.520055 -0.1761397
为什么+/-
两个分析的符号()不同?如果那时我在回归中使用主成分PC1
并将其PC2
用作预测变量,即lm(y ~ PC1 + PC2)
,这将完全改变我对这两个变量的影响的理解,y
具体取决于我所使用的方法!那我怎么能说对PC1
例如有正面影响y
而PC2
对例如有负面影响y
呢?
另外:如果PCA组件的符号没有意义,那么对于因子分析(FA)也是如此吗?翻转(反转)单个PCA / FA组件得分(或载荷,作为载荷矩阵的列)的符号是否可接受?