一尾测试和二尾测试之间的区别?


13

在学习统计课程时,我试图了解一尾和二尾假设检验之间的区别。具体来说,为什么一尾测试拒绝零,而二尾测试却不呢?

一个例子:

一尾假设检验和二尾假设检验之间的差异


请注意,您仅在指定的重要性级别拒绝。您仍然可以通过将显着性水平提高到10%来拒绝两个假设。如果您将显着性水平降低到1%,您也将无法拒绝这两者。
概率

Answers:


11

两条尾巴的测试会测试两个方向的差异。因此,P值将是t = 1.92右侧t分布下的面积加上t = -1.92左侧t分布下的面积。这是单尾测试面积的两倍,因此P值是两倍。

如果您使用单尾测试,则可以提高性能,但是潜在的代价是必须忽略与获得数据之前假设的方向相反的差异。如果在形式化和记录假设之前获得了数据,那么您实际上应该使用两尾检验。同样,如果您对任一方向的效果都感兴趣,可以使用双尾测试。实际上,您可能希望使用两尾测试作为默认方法,并且仅在效果只能在一个方向上存在的异常情况下才使用单尾测试。


迈克尔,谢谢您的评论。这是我不明白的地方:对于双尾测试,曲线下的面积怎么能变成两倍?由于alpha = 0.05,P是否在两种情况下都不相同?
陆慈

在您的问题中,alpha只是您决定什么p均值(是否为null)的临界点。因此,它不会影响p的值。
约翰

有点挑剔,但不需要在查看数据之前选择假设的想法。您可以进行两个单方面的测试。您将始终拒绝数据不支持的方向。因此,选择数据偏爱的单面测试是有意义的。
概率

1
@probabilityislogic-我完全同意,除了有人希望alpha值反映实际的长期假阳性错误率(即有人想使用Neyman-Pearson方法)时。如果您使用单面测试并根据观察到的效果决定测试变化的方向,那么您得到的假阳性结果将是您的alpha水平所暗示的准确两倍。
Michael Lew 2012年

对于那些一直忽略先前数据的人来说,这只是长期错误率。这不是获得良好长期性能的好方法。通过意义给出的误差率是所有我们可以观察到的数据集一次
概率

5

对于二尾检验,曲线下的面积不是两倍:对于临界p = .05的二尾检验,您正在测试从零值分布的较低或较高的2.5%提取观察到的数据的频率(总共.05)。使用1尾测试,您将测试数据(来自预先指定的)尾部的5%尾部的极端5%频率。

在某种程度上,您的问题的答案是一种实践:大多数研究人员认为报告1尾测试的实验不太可能重复(即,他们认为研究人员选择此方法是为了使统计数据“有意义”)。

但是,存在有效的用例。如果您知道在所测试的理论下不可能有任何相反的结果,那么,正如前面的评论所指出的,您可以提前指定该值并进行1尾测试。同样,大多数人仍然会谨慎地看待这一点。


1

小号d[R[R

小号d=|Ť||Ť|>Ť0Ť0α小号d=ŤŤ>Ť1个Ť1个P[R|Ť|>Ť0|H0P[RŤ>Ť0|H0Ť0Ť1个

这就引出了一个问题:为什么要使用不同的检验统计量?原因是备选方案不同,因此每个检验统计量的功效也不同。具体来说,如果我们使用其他测试的测试统计量和拒绝区域,则每个测试的功效都会降低(假设我们使用相同的显着性)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.