这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型:
a.lm = lm(Y ~ x1 + x2)
x1
是一个连续变量。x2
是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于:
summary(a.lm)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.521 0.20 1.446 0.19
x1 -0.61 0.11 1.451 0.17
x2Low -0.78 0.22 -2.34 0.005
x2Medium -0.56 0.45 -2.34 0.005
我知道R在这种因素(x2
是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2
“高”值?例如,x2
在此处给出的示例中,“ High” 对响应变量有什么影响?
我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。