荷载(不应与特征向量混淆)具有以下属性:
- 它们在每个分量内的平方和就是特征值(分量的方差)。
- 载荷是线性组合的系数,该系数通过(标准化)组件预测变量。
您从4个中提取了2台PC。荷载矩阵和特征值:一种
A (loadings)
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
Eigenvalues:
1.0000000000 1.0000000000
在这种情况下,两个特征值相等。在现实世界中这是一种罕见的情况,它表示PC1和PC2具有相同的解释“强度”。
假设您还计算了组件值Nx2
矩阵,并且在每一列中对其进行了z标准化(平均值= 0,标准偏差= 1)。然后(如以上第2点所述)。但是,由于仅剩4台PC中的2台(缺少2列),因此恢复的数据值是不正确的,-会出错(如果特征值3、4不正确零)。X = C ^ 甲'甲XCX^=CA′AX^
好。通过变量预测成分的系数是多少?显然,如果已满,则将为。对于非正方形加载矩阵,我们可以将它们计算为,其中是对角线矩阵,其对角线具有特征值,并且上标表示伪逆。在您的情况下:乙= (甲- 1)'乙= 甲⋅ d 我一克(ê 我克Ë Ñ v 一个升Ù ë 小号)- 1 = (甲+ )'A4x4
B=(A−1)′B=A⋅diag(eigenvalues)−1=(A+)′diag(eigenvalues)
+
diag(eigenvalues):
1 0
0 1
B (coefficients to predict components by original variables):
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
因此,如果是原始中心变量(或标准化变量,如果您基于相关性而不是协方差进行PCA )的矩阵,则;是标准化的主成分评分。在您的示例中是:C = X B CXNx4
C=XBC
PC1 = 0.5 * X1 + 0.5 * X2 + 0.5 * X3 + 0.5 * X4〜(X1 + X2 + X3 + X4)/ 4
“第一部分与平均分数成正比”
PC2 = 0.5 * X1 + 0.5 * X2-0.5 * X3-0.5 * X4 =(0.5 * X1 + 0.5 * X2)-(0.5 * X3 + 0.5 * X4)
“第二部分测量第一对分数和第二对分数之间的差异”
在此示例中,似乎很明显,但通常情况下它们是不同的。B=A
注意:上面用于计算组件分数的系数的公式等效于,其中为变量的协方差(或相关)矩阵。后一个公式直接来自线性回归理论。这两个公式仅在PCA上下文中等效。在因子分析中,它们不是,并且要计算因子得分(在FA中始终近似),应该依靠第二个公式。乙= - [R - 1甲řB=A⋅diag(eigenvalues)−1B=R−1AR
我的相关答案:
关于载荷与特征向量的更详细说明。
如何计算主成分得分和因素得分。