Answers:
考虑到它们都可以写成回归方程(也许与传统形式的解释略有不同)。
回归:
t检验:
ANOVA:
根据下面的@whuber的评论,这些也可以通过矩阵方程表示:
表示,和是长度向量,是长度为的向量。现在是具有行和列的矩阵。在原型回归中,您有连续的变量和截距。因此,您的矩阵由一系列并列的列向量组成,每个
如果您用这种方式用组表示ANOVA ,请记住,您将有虚拟变量指示组,而参考组由观察值指示,每个观察变量中都有。如上所述,您仍然会有拦截。因此,。 g − 1 0 p = g − 1
它们都可以写为一般线性模型的特殊情况。
t检验是ANOVA的两个样本。如果对t检验统计量求平方,则在ANOVA中将获得相应的
ANOVA模型基本上只是一种回归模型,其中因子水平由虚拟(或指标)变量表示。
因此,如果t检验模型是ANOVA模型的子集,而ANOVA是多元回归模型的子集,则回归本身(以及除回归以外的其他事物)是常规线性模型的子集,该模型将回归扩展为与通常的回归情况(“独立”和“等方差”)相比,误差项的定义更为笼统,并且对变量进行了多元化。
这是一个示例,显示了在R中完成的普通(等方差)两个样本分析和回归模型中的假设检验的等价关系(实际数据看起来是成对的,因此这实际上不是合适的分析) :
> t.test(extra ~ group, var.equal=TRUE, data = sleep)
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
请注意,上面的p值为0.079。这是方差分析的一种方法:
> summary(aov(extra~group,sleep))
Df Sum Sq Mean Sq F value Pr(>F)
group 1 12.48 12.482 3.463 0.0792
Residuals 18 64.89 3.605
现在进行回归:
> summary(lm(extra ~ group, data = sleep))
(某些输出已删除)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7500 0.6004 1.249 0.2276
group2 1.5800 0.8491 1.861 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared: 0.1613, Adjusted R-squared: 0.1147
F-statistic: 3.463 on 1 and 18 DF, p-value: 0.07919
比较“ group2”行中的p值,并比较最后一行中F检验的p值。对于双尾测试,它们是相同的,并且都与t检验结果匹配。
此外,“ group2”的系数表示两组的均值之差。