以矩阵形式,您的模型采用通常的形式。 E[Y]=Xβ
第一个模型表示由行的第一组的元件在,对应于截距,2类的指示器,并且指示器为类别3它表示由所述第二组的元件行和的第三组元素。(1,0,0)X(1,1,0)(1,0,1)
第二个模型改为使用,和。(1,1,12)=(1,1,1)(1,2,22)=(1,2,4)(1,3,32)=(1,3,9)
我们将生成的模型矩阵称为和。它们是简单相关的:一个的列是另一个的列的线性组合。例如,让X1X2
V=⎛⎝⎜100112138⎞⎠⎟.
然后因为
⎛⎝⎜111010001⎞⎠⎟V=⎛⎝⎜111123149⎞⎠⎟,
它遵循
X1V=X2.
因此,模型本身与
X1β1=E[Y]=X2β2=(X1V)β2=X1(Vβ2).
也就是说,第二个模型的系数必须与第一个模型的系数β2
β1=Vβ2.
因此,它们的最小二乘估计值也具有相同的关系。这表明模型具有相同的拟合度:它们只是以不同的方式表达它们。
由于两个模型矩阵的第一列相同,因此分解第一列和其余列之间的方差的任何ANOVA表都不会更改。但是,区分第二列和第三列的ANOVA表将取决于数据的编码方式。
在几何上(并且更抽象一些),列生成的的三维子空间与列生成的子空间一致。因此,模型将具有相同的拟合度。仅因为用两个不同的基数描述了空格,所以拟合的表达方式有所不同。 X 1 X 2R15X1X2
为了说明这一点,这里有与您一样的数据(但响应不同)和中生成的相应分析R
。
set.seed(17)
D <- data.frame(group=rep(1:3, each=5), y=rnorm(3*5, rep(1:3, each=5), sd=2))
适合两个模型:
fit.1 <- lm(y ~ factor(group), D)
fit.2 <- lm(y ~ group + I(group^2), D)
显示其方差分析表:
anova(fit.1)
anova(fit.2)
第一个模型的输出是
Df Sum Sq Mean Sq F value Pr(>F)
factor(group) 2 51.836 25.918 14.471 0.000634 ***
Residuals 12 21.492 1.791
对于第二个模型是
Df Sum Sq Mean Sq F value Pr(>F)
group 1 50.816 50.816 28.3726 0.0001803 ***
I(group^2) 1 1.020 1.020 0.5694 0.4650488
Residuals 12 21.492 1.791
您可以看到平方的残差总和是相同的。通过在第二个模型中添加前两行,您将获得相同的DF和平方和,由此可以计算出相同的均方根,F值和p值。
最后,让我们比较系数估计。
beta.1.hat <- coef(fit.1)
beta.2.hat <- coef(fit.2)
输出是
(Intercept) factor(group)2 factor(group)3
0.4508762 2.8073697 4.5084944
(Intercept) group I(group^2)
-3.4627385 4.4667371 -0.5531225
甚至截距也完全不同。 那是因为多元回归中任何变量的估计都取决于所有其他变量的估计(除非它们都相互正交,这两个模型都不是这种情况)。但是,请看乘法完成了什么:V
⎛⎝⎜100112138⎞⎠⎟⎛⎝⎜−3.46273854.4667371−0.5531225⎞⎠⎟=⎛⎝⎜0.45087622.80736974.5084944⎞⎠⎟.
配合确实与要求的一样。