当或时,您是否拒绝原假设?


14

显然,这仅是定义或约定的问题,几乎没有实际意义。如果设置为传统值0.05,则值0.0500000000000 ...是否被视为具有统计意义?定义统计显着性的规则通常被认为是p <\ alphap \ leq \ alpha吗?αpp<αpα


3
在许多情况下(例如,通常的z检验zt检验),区别实际上并不重要,因为p值恰好是.05 的概率为0。
2012年

1
在一个非常一般的意义上讲,它并没有多大关系,因为(只给出非常温和的假设) -值均匀的零假设下发布。p
主教

4
离散分布族@Cardinal 会出现此问题。
ub

1
@MichaelChernick,我同意您所说的一切,但是OP在编写自动假设检验功能的过程中询问了这个问题:当值完全等于时,该功能是否应该拒绝?pα
2012年

2
@Macro在那种情况下,它确实没有关系。我会说掷硬币,但这会引入随机元素。我认为最简单的方法是,如果必须将0.05作为截止值,则始终拒绝精确计算为p的0.05的p值。对于计算机算法,重要的是一致性和文档。Whay正在为所有这些复杂的答案提供一个简单的答案,正如Harvey所说的那样,他自己的惯例并不重要。
Michael R. Chernick

Answers:


13

依靠Lehmann和Romano,测试统计假设。地说,将定义为拒绝区域,将为原假设区域,我们有以下陈述p。57在我的副本中:S1ΩH

因此,人们选择一个介于0和1之间的数字,称为有效级别,并施加以下条件:α

...Pθ{XS1}α for all θΩH

由于很有可能,因此您将拒绝使用p值。Pθ{XS1}=αα

在更直观的水平上,假设在离散参数空间上进行测试,并在无效假设下以0.05的概率恰好在最佳(最强大)拒绝区域进行测试。假设在原假设下,第二个最大的(按概率计)最佳排斥区域的概率为0.001。再次凭直觉来讲,要说第一个区域不等于“达到95%的置信度...”决定,而您必须使用第二个区域才能达到95%,这很难证明是合理的。信心水平。


11

您已经谈到了一个有趣且有争议的问题。可以通过这张图片幽默地总结一下(可在Andrew Gelman的博客上找到,但最初由Dan Goldstein提供):

神奇的p值

首先,.05没有什么神奇之处。只要您预先选择阈值,阈值.1或.01可能就有意义。为此,无论是选择要使用的截止0.05也同样合理的,前提是你没有通过在观察你的p值后,改变你的截止作弊。<.05.05

<.05


感谢您的精彩图片。我以前没看过。滑稽。和。是的,科学家对0.05截止点的重视程度过高。我同意从逻辑或数学的观点来看,<。05或≤.05都是同等合理的。我要问的是,是否有任何惯例被更频繁地使用。
哈维·莫图尔斯基

爱图!
rolando2 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.