我确定我已经完全把它包裹在头上了,但是我只是想不通。
t检验使用Z分布比较两个正态分布。这就是为什么DATA中存在正常性的原因。
与OLS一样,ANOVA等效于具有虚拟变量的线性回归,并且使用平方和。这就是为什么存在RESIDUALS正常性的假设。
我花了几年的时间,但我认为我终于掌握了这些基本事实。那么为什么t检验等同于两组ANOVA?如果他们甚至不对数据假设相同的东西,怎么能等效呢?
我确定我已经完全把它包裹在头上了,但是我只是想不通。
t检验使用Z分布比较两个正态分布。这就是为什么DATA中存在正常性的原因。
与OLS一样,ANOVA等效于具有虚拟变量的线性回归,并且使用平方和。这就是为什么存在RESIDUALS正常性的假设。
我花了几年的时间,但我认为我终于掌握了这些基本事实。那么为什么t检验等同于两组ANOVA?如果他们甚至不对数据假设相同的东西,怎么能等效呢?
Answers:
两组的t检验假设每个组的正态分布具有相同的方差(尽管在替代假设下均值可能有所不同)。这等效于带有虚拟变量的回归,因为回归允许每个组的均值不同但方差不同。因此,残差(等于减去了组均值的数据)具有相同的分布---即它们的正态分布为零均值。
方差不相等的t检验不等同于单向方差分析。
t检验只是F检验的一种特殊情况,其中仅比较两组。两者的结果在p值方面将完全相同,并且F和t统计量之间也存在简单关系。F = t ^ 2。这两个测试在代数上是等效的,并且它们的假设是相同的。
实际上,这些等效项扩展到ANOVA,t检验和线性回归模型的整个类别。t检验是ANOVA的特例。方差分析是回归的一种特殊情况。所有这些程序都包含在通用线性模型下,并且具有相同的假设。
您可能会认为它是数据中的正态性,但是您正在检查每个组中的正态性,这实际上与在模型中唯一的预测变量是组的指标时检查残差中的正态性相同。同样,方差相等。
顺便说一句,R没有用于ANOVA的单独例程。R中的方差分析函数只是lm()函数的包装程序-用来拟合线性回归模型的同一事物-略有不同的包装,以提供通常在ANOVA摘要而不是回归摘要中发现的内容。
aov()
构建在该lm()
函数之上,但包含其他称为特殊术语的参数,例如Error
。
我完全同意Rob的回答,但让我换一种说法(使用维基百科):
因此,我将驳斥这个问题,因为它们显然具有相同的假设(尽管顺序不同:-))。
每个人都忽略了一个显而易见的观点:使用ANOVA,您正在测试均值相同的零值,无论您的解释变量的值如何。使用T检验,您还可以测试单面情况,即,给定解释变量的一个值比给定另一个的平均值明显更大。
由于某些原因,我宁愿使用t检验比较两组,并且将ANOVA用于2组以上。重要的原因是均等假设。