为什么在方差分析(ANOVA)中使用单尾检验F检验?


13

您能给出在方差分析中使用单尾检验的原因吗?

为什么在方差分析中使用单尾检验-F检验?


2
一些指导您思考的问题...负t统计量是什么意思?F统计量可能为负吗?极低的F统计量是什么意思?高F统计量是什么意思?
russellpierce

为什么您会觉得单尾测试必须是F检验?回答您的问题:F检验可以用一个以上的线性参数组合检验假设。
IMA

1
您是否想知道为什么要使用单尾而不是两尾测试?
詹斯·库罗斯

@tree对于您而言,什么构成可信或官方来源?
Glen_b-恢复莫妮卡

1
@tree请注意,Cynderella在这里的问题不是关于方差的检验,而是关于方差分析的F检验-这是均值均等检验。如果您对方差相等性测试感兴趣,则可以在此站点上的其他许多问题中进行讨论。(对于方差检验,是的,您确实关心两条尾巴,正如本节最后一句中“ 属性 ” 上方清楚说明的那样)
Glen_b-恢复莫妮卡(Monica

Answers:


17

F测试最常用于两个目的:

  1. 在方差分析中,用于检验均值是否相等(以及各种类似的分析);和

  2. 在检验方差相等时

让我们依次考虑一下:

1)构造方差分析中的F检验(以及类似的计数数据的卡方检验),以使数据与替代假设的一致性越强,则检验统计量往往越大,而样本的排列方式看起来与null最一致的数据对应于测试统计量的最小值。

考虑三个样本(大小为10,样本方差相等),并将它们安排为具有相等的样本均值,然后以不同的模式移动其均值。随着样本均值的变化从零开始增加,F统计量变得更大:

3个样本的排列以及相应的F统计量

黑线()是数据值。红色粗线()是组均值。|||

如果零假设(总体均值的均等)为真,则您会期望样本均值会有一些变化,并且通常会期望看到F比率大约为1。期望...所以您不会得出总体均值不同的结论。

也就是说,对于ANOVA,当您获得异常大的F值时,您将拒绝均值相等的假设,而当您获得异常小的值时,您将不会拒绝均值相等的假设(这可能表示某些东西,但人口均值不同)。

这是一个示例,可以帮助您看到我们只想在F处于其上尾时拒绝:

F用于ANOVA的描述,当F统计量位于上尾时拒绝

2)F检验方差是否相等*(基于方差比)。在此,如果分子样本方差远大于分母中的方差,则两个样本方差估计值的比率将很大,而如果分母样本方差远大于分子中的方差,则两个样本方差估计值的比率将很小。

也就是说,为了测试总体方差的比率是否不同于1,您将要拒绝F的大值和小值都为null的情况。

*(不考虑此测试的分布假设的敏感性高(还有更好的选择),还有一个问题,如果您对ANOVA等方差假设的适用性感兴趣,那么您最好的策略可能不是正式测试。)


2
@TaylerJones Levene的测试更可靠。Browne-Forsythe更加健壮(但会损失一些力量,接近正常水平)。Fligner-Killeen再次如此。几十年来,我使用Levene或Browne-Forsythe的次数不超过两次。(如果再次出现这种情况,可能像Browne-Forsythe之类的东西对我来说很好,但我通常不会遇到测试多个组方差相等的任何意义。)
Glen_b-恢复莫妮卡(Monica

2
我很客气。我仍然不明白为什么在ANOVA中使用单尾。更具体地说,根据您的讨论,我了解到在零假设下我不会有任何治疗效果,因此将接近,而如果替代假设为真,则比率将更大。但是,这如何暗示“这就是在ANOVA中使用单尾检验的原因?” 1FF=MSTREATMENTMSERROR1F
时间

2
@tree听起来好像您对一般的假设检验不太了解,但是很难确定确切的位置。您说您了解,如果获得大F,则您想拒绝;如果获得小F,您就不想拒绝。F的大值是上尾的那些值,而F的小值是下尾的那些值。仅当值较大时才想拒绝...即在上尾巴,而不是在下尾巴。你怎么看不到那是一条尾巴?我将介绍另一个可能会有所帮助的情节。
Glen_b-恢复莫妮卡

1
@jeramy我的评论是指依赖于方差比的测试(具体来说,我说“ 这里,两个样本方差估计的比值将 ……”)。您所指的测试是从某个位置量度中寻找绝对残差中的位置差异,以便发现扩展中的差异。他们自然会按照位置差异测试的方式工作。由于我试图显示一种情况,您看到F的较低尾部,因此Brown-Forsythe(以及一些其他测试,它们会在某种程度上测量位置差异,以推断出展布差异)将无济于事
Glen_b -恢复莫妮卡2015年

1
@jeramy我添加了几句话使其更加明确。您可能要注意,即使Brown-Forsythe,Levene等使用 F表,即使在测试假设下,测试统计信息的分布实际上也不是F分布的。
Glen_b-恢复莫妮卡2015年

2

必须理解,方差分析的目的是检查均值是否不等...这意味着我们与样本之间的差异相比,关注的是样本之间的较大差异(因此,均值是根据均值计算得出的) (再次根据各个样本平均值计算得出)。当样本之间的差异较小时(导致F值位于左侧),这无关紧要,因为该差异不明显。如果样本之间的差异显着高于内部变异,则样本之间的变异很重要;在这种情况下,F值将大于1,因此在右尾。

唯一的问题仍然是,为什么将整个重要性范围放在右尾,答案仍然相似。仅当F比在右侧时才发生拒绝,而当F比在左侧时就不会发生拒绝。重要程度是由于统计限制而导致的错误的度量。由于拒绝仅发生在右侧,因此整个重要性级别(错误结论的错误风险)都保留在右侧。`


0

处理内均方(MS)的期望值是总体方差,而处理间MS的期望值是群体方差加上处理方差。因此,F = MS之间/ MSwithin之比始终大于1,并且永远不小于1。

由于1尾测试的精度优于2尾测试,因此我们更喜欢使用1尾测试。


我不认为第一段最后一句中的主张是正确的……E(分子)> E(分母)并不意味着分子>分母。
Glen_b-恢复莫妮卡

除了Glen_b的观点,我不确定“由于1尾测试的精度优于2尾测试,因此我们更喜欢使用1尾测试”。您能解释一下这个意思吗?在我看来,谈论精度似乎没有抓住重点。
银鱼

精度等于半个置信区间。对于相同的F统计量,1尾检验将拒绝具有较小p值(实际上是一半)的原假设。反之,尾巴检验可以拒绝F-stat值较小的零假设。这意味着1尾检验可以用更少的样本或样本中存在更常见的原因差异来检测治疗效果。如果正在寻找一种效果,这将使1尾部测试更为理想。
杰夫·科特

是的,计算出的F统计量可以小于1.0。然而,该结论将无法拒绝“无治疗效果”的零假设。因此,下尾部没有关键区域。因此,F检验是上单尾检验。在ANOVA中,逻辑参数基于MS_treat和MS_error的期望值。在“无治疗效果”假设下,H0:E(MS_treat)= E(MS_error)=总体方差。任何明显的治疗效果都会导致HA:E(MS_treat)> E(MS_error)。(摘自有关ANOVA的任何蒙哥马利文字)。因此,HA意味着单尾测试。
杰夫·科特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.