使用ANOVA而不是t检验来比较两个均值是错误的吗?


11

我有薪水分配,我想比较男性和女性在收入上的差异。我知道有用于比较两种均值的学生T检验,但在建议ANOVA之后,我收到了一些批评,说ANOVA用于比较两种以上均值。

使用它仅比较两个均值有什么错误(如果有的话)?


9
谁说错了?
gung-恢复莫妮卡

1
您为什么不改写这个抑制任何假设的问题?类似于“比较两组时,方差分析是否等同于t检验?” 只是一个主意...我对问题的受欢迎程度不承担任何责任:-)
Antoni Parellada

4
或者,修改您的问题以显示有人说错了...,以便我们可以解释他们错了。这里的困难是错误(错误)的前提。
Glen_b-恢复莫妮卡

1
尽管前提是错误的,但这个问题似乎并没有超出主题范围或不清楚,无法回答(实际上,已经回答了)。我认为这可以保持开放。
gung-恢复莫妮卡

1
同意,@ gung。我认为这个问题反映出对该主题的知识不足。如果用不同的措词(或“更好”),则可能不会提出该问题,因为那时他们已经知道答案了。
D_Williams

Answers:


20

这没有错,并且在假设相等方差的情况下等同于测试。此外,对于两个组,sqrt(f-statistic)等于t统计量的(估计值)。我对方差不相等的t检验并不等效充满信心。由于当方差不相等时(方差通常总是不等于小数位),您可以获得适当的估计,因此使用t检验可能是有意义的,因为它比方差分析更灵活(假设您只有两组)。

更新:

下面的代码显示相等方差t检验的t统计量^ 2,而不是不相等t检验的t统计量^ 2与f统计量相同。

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

3
+1,请注意,可以针对不相等的方差调整单向ANOVA / F检验(请参见异方差数据的单向ANOVA替代方法)。
gung-恢复莫妮卡

@gung OK。我不确定这一点,因为我有一段时间没有使用ANOVA(开始做贝叶斯的事情)。
D_Williams

ŤŤ

4

它们是等效的。只有两组的方差分析相当于t检验。区别在于,当您有多个组时,由于无法共同检验假设,因此t检验的I型错误会增加。当您通过F检验共同测试它们时,ANOVA不会遭受此问题的困扰。


1
我不认为它会失去功能,我认为它与错误类型有关。通常,测试越多,您应该获得的功率就越高。
HelloWorld 2013年

我相信(如@StudentT所说),这是类型I错误的问题,在某种程度上,我认为他们正在使我们为此使用“ Bonferroni校正”。en.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez

是的,你是正确的。它不应为电源(II型),而应为I型错误。我相信推理是正确的,但是出于某种原因,我写了一些能力,而不是第1类错误。我将进行编辑以确保不会欺骗任何人。
robinsa
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.