如果在线性回归中我有分类变量...我怎么知道分类变量的静态意义?
假设因子有10个级别...在一个因子变量的保护下将有10个不同的最终t值...
在我看来,是否对因子变量的每个水平都进行了统计意义检验?没有?
@Macro:根据您的建议,我建立了以下示例:
通过下面的模型比较,似乎x3很有用,并且必须将其包括在模型中。
但是实际上那是错误的...
n=100
x1=1:n
x2=(1:n)^2
x3=rnorm(n)
ee=rnorm(n)
y=3*x1-2*x2+x3+3+ee
lm1=lm(y~x1+x2+x3)
summary(lm1)
lm2=lm(y~x1+x2)
summary(lm2)
anova(lm1, lm2)
> anova(lm1, lm2)
Analysis of Variance Table
Model 1: y ~ x1 + x2 + x3
Model 2: y ~ x1 + x2
Res.Df RSS Df Sum of Sq F Pr(>F)
1 96 82.782
2 97 146.773 -1 -63.99 74.207 1.401e-13 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
x3
生成y
s的,所以应该将其包括在模型中,并且值与该结论一致。