如果两组的t检验和ANOVA相等,为什么它们的假设不相等?


47

我确定我已经完全把它包裹在头上了,但是我只是想不通。

t检验使用Z分布比较两个正态分布。这就是为什么DATA中存在正常性的原因。

与OLS一样,ANOVA等效于具有虚拟变量的线性回归,并且使用平方和。这就是为什么存在RESIDUALS正常性的假设。

我花了几年的时间,但我认为我终于掌握了这些基本事实。那么为什么t检验等同于两组ANOVA?如果他们甚至不对数据假设相同的东西,怎么能等效呢?


15
一点:t检验使用t分布而不是Z分布
Jeromy Anglim

1
即使问题不正确,它也非常有用。另外,我认为在某处提及“双尾t检验”会使问题/答案更加完整。
Gaurav Singhal

Answers:


29

两组的t检验假设每个组的正态分布具有相同的方差(尽管在替代假设下均值可能有所不同)。这等效于带有虚拟变量的回归,因为回归允许每个组的均值不同但方差不同。因此,残差(等于减去了组均值的数据)具有相同的分布---即它们的正态分布为零均值。

方差不相等的t检验不等同于单向方差分析。


3
我可以查找引用,但这很容易进行经验检验。来自具有两个组的ANOVA的F完全等于t ^ 2,并且p值将完全相同。在方差不相等的情况下不相等的唯一原因是您应用了更正。否则,它们是相同的。
Brett 2010年

3
F检验是t检验的推广。t检验用于2种治疗的比较,F检验用于多种治疗。推导是在Casella的统计设计的第3章和第4章中进行的。但是,正如Hyndman教授所指出的,在方差不相等的情况下,它不再是t检验。这是费舍尔·贝伦的问题。我们通常不使用Fisher的解决方案,而是使用Welch检验或贝叶斯方法。
suncoolsu 2011年

方差不相等的两样本t检验确实等于两组的单向方差分析。也许您的意思是使用不等方差校正(即Welch)进行的t检验与未校正的单向方差分析(ANOVA)不同(尽管为什么会这样)?
Brett

20

t检验只是F检验的一种特殊情况,其中仅比较两组。两者的结果在p值方面将完全相同,并且F和t统计量之间也存在简单关系。F = t ^ 2。这两个测试在代数上是等效的,并且它们的假设是相同的。

实际上,这些等效项扩展到ANOVA,t检验和线性回归模型的整个类别。t检验是ANOVA的特例。方差分析是回归的一种特殊情况。所有这些程序都包含在通用线性模型下,并且具有相同的假设。

  1. 意见的独立性。
  2. 残差的正态性=在特殊情况下每组的正态性。
  3. 残差方差相等=在特殊情况下组间方差相等。

您可能会认为它是数据中的正态性,但是您正在检查每个组中的正态性,这实际上与在模型中唯一的预测变量是组的指标时检查残差中的正态性相同。同样,方差相等。

顺便说一句,R没有用于ANOVA的单独例程。R中的方差分析函数只是lm()函数的包装程序-用来拟合线性回归模型的同一事物-略有不同的包装,以提供通常在ANOVA摘要而不是回归摘要中发现的内容。


有兴趣知道如何使用lm拟合重复测量ANOVA模型。
AndyF 2010年

1
本文介绍了分类变量的编码,回归和ANOVA模型的等价性以及重复测量的回归编码的问题。dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts / ...这是引文……加拿大,文多夫(2004)。多元回归编码入门:常见形式和重复对比的其他情况。理解统计3,47-57。
布雷特

4
@AndyF不是lm(),除非您使用nlmelme4包转移到混合模型,但是有一种便捷的方法可以通过适当地指定中的Error术语来处理重复测量aov(),请参见Baron&Li教程§6.9,j.mp /中的
chl

@AndyF aov()构建在该lm()函数之上,但包含其他称为特殊术语的参数,例如Error
chl 2010年

aov()只是lm()的包装器。它在幕后进行一些对比编码,并将结果打包为ANOVA样式。所有这些都由lm()建模。在我上面引用的文章中,它告诉您如何设置编码以在包括lm()的回归模型中进行重复对比。
Brett 2010年

17

我完全同意Rob的回答,但让我换一种说法(使用维基百科):

假设方差分析

  • 案例独立性–这是简化统计分析模型的假设。
  • 正态性–残差的分布是正态的。
  • 方差的均等(或“均质性”),称为均方差

假设t检验

  • 被比较的两个总体中的每一个都应遵循正态分布...
  • ...正在比较的两个总体应该具有相同的方差...
  • 用于进行测试的数据应独立于被比较的两个总体进行采样。

因此,我将驳斥这个问题,因为它们显然具有相同的假设(尽管顺序不同:-))。


请参阅对Rob的评论。
Alexis 2014年

@Alexis我不确定我是否理解你的不赞成意见。精心阐述。
亨里克(Henrik)2014年

第二个t检验假设是不正确的。学生的原始工作通过这种方式进行了假设,但是“不均等方差”是在以后的测试中足够普遍的假设。
亚历克西斯

5

每个人都忽略了一个显而易见的观点:使用ANOVA,您正在测试均值相同的零值,无论您的解释变量的值如何。使用T检验,您还可以测试单面情况,即,给定解释变量的一个值比给定另一个的平均值明显更大。


1
除非我没有记错,否则没什么不同。如果对两组进行方差分析,则可以像进行t检验一样进行“单面检验”。我将“单面测试”用引号引起来,因为“单面测试”和“两面测试”之间的“测试”实际上没有区别。唯一的区别是您如何解释p值的统计意义。因此,单面测试与双面“测试”是完全相同的“测试”。只有正确解释结果的方式不同。
Tripartio '18

-3

由于某些原因,我宁愿使用t检验比较两组,并且将ANOVA用于2组以上。重要的原因是均等假设。


5
欢迎来到该站点,@ syed。您介意扩展答案吗?例如,您指的是什么“原因”?请注意,这两个 t检验和方差分析假定方差相等。
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.