看起来实际上是比较截距,而不是斜率?
您在这里的困惑涉及这样一个事实,您必须非常小心,以清楚了解所指的截距和斜率(截取什么?斜率是什么?)。
0-1虚拟变量的系数在回归中的作用既可以看作是斜率,也可以看作是截距的差。
让我们通过考虑两个样本的情况来尽可能简化事情。
我们仍然可以对两个样本进行单向方差分析,但事实证明它与两尾两样本t检验(等方差情况)基本相同。
这是人口状况的图表:
如果,则总体线性模型为δ=μ2-μ1个
ÿ=μ1个+ δx + e
因此,当(这是我们在组1中的情况),的平均值是而当(当我们在组2中时) ,的平均值为。x = 0ÿμ1个+δ× 0 =μ1个x = 1ÿμ1个+ δ× 1 =μ1个+μ2-μ1个=μ2
那就是斜率的系数(在这种情况下为),均值之差(您可能会认为这些均值是截距)是相同的数量。δ
为了帮助具体,这里有两个示例:
Group1: 9.5 9.8 11.8
Group2: 11.0 13.4 12.5 13.9
他们看起来如何?
手段差异的检验是什么样的?
作为t检验:
Two Sample t-test
data: values by group
t = -5.0375, df = 5, p-value = 0.003976
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-4.530882 -1.469118
sample estimates:
mean in group g1 mean in group g2
9.9 12.9
作为回归:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.9000 0.4502 21.991 3.61e-06 ***
groupg2 3.0000 0.5955 5.037 0.00398 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7797 on 5 degrees of freedom
Multiple R-squared: 0.8354, Adjusted R-squared: 0.8025
F-statistic: 25.38 on 1 and 5 DF, p-value: 0.003976
从回归中我们可以看到,截距项是组1的均值,而组g2系数(“斜率”系数)是组均值的差。同时,回归的p值与t检验的p值相同(0.003976)