p值的微妙之处:更大等于更大


11

当我阅读Wassermann的《所有统计》一书时,我注意到p值的定义有些微妙,我无法理解。Wassermann非正式地将p值定义为

[..] 观察测试统计值等于或大于实际观察值的概率(在下)。H0

重点已添加。正式上也一样(定理10.12):

假设大小测试的形式为α

仅当T(X ^ n)\ ge c_ \ alpha时拒绝H_0H0T(Xn)cα

然后,

p-value=supθΘ0Pθ0[T(Xn)T(xn)]

其中xnX ^ n的观测值Xn。如果Θ0={θ0}

p-value=Pθ0[T(Xn)T(xn)]

此外,Wassermann将Pearson的χ2检验(和其他类似的检验)的p值定义为:

p-value=P[χk12>T].

我想澄清的部分是第一个定义中的大等号()和第二个定义中的大号(>)。我们为什么不写T,它会匹配“ 等于或大于极限” 的第一引号?

这是绝对的方便,以便我们将p值计算为吗?我注意到R也使用带有符号的定义,例如in 。1F(T)>chisq.test


5
如果测试统计信息是连续的,您是否知道两个定义的p值相同?
mark999 2014年

3
对于连续分布并不重要,但是这个事实不应该使您忘记和之间的区别,因为在数学上这很重要。这在应用程序中也很重要,因为由于“现实生活的离散性”,我们实际上可能会遇到恰好 p值。<α
HorstGrünbusch2014年

Answers:


11

“等于或大于极限”是正确的。

形式上,那么,如果该分布使得获得检验统计量本身的概率为正,则该概率(以及任何极端的概率,例如另一尾的相应值)应包括在p值中。

当然,对于连续统计量,完全相等的概率为0。如果我们说或,则没有区别。>


4

的第一点是假设空间在整个参数空间内在拓扑上是封闭的。如果您对属于该假设的参数收敛序列有一些断言,那么无需考虑随机性,这将是一个有用的约定,因为这样您便会知道该限制并不突然属于替代项。

现在考虑概率分布,它们通常是右连续的。这意味着封闭的假设空间到区间的映射再次被封闭。这就是为什么置信区间也按惯例关闭的原因。[0,1]

这增强了数学。想象一下,您将为非对称概率分布的位置参数构造一个置信区间。在那里,您必须将长度换成上尾巴,将长度换成下尾巴。两条尾巴的概率总和为。要使CI尽可能多地提供信息,您必须缩短CI的长度,以使其覆盖率仍然为。这是一个封闭的集合。您可以通过一些迭代算法(例如Banach的不动点定理)找到最佳解。如果是开放集,则无法执行此操作。α1α

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.