健全性检查:p值可以走多低?


24

我正在使用ranksum检验来比较两个样本的中位数(),发现它们与显着不同。我应该对这么小的值感到怀疑还是应该将其归因于与非常大的样本相关的高统计能力?有任何可疑的低值之类的东西吗?ñ=120000p = 1.12E-207pp


Answers:


30

标准计算机上的P值(使用IEEE双精度浮点数)可以低至大约。当效果大小较大和/或标准误差较小时,这些可以是合法正确的计算。如果使用T或正态分布进行计算,则您的值对应于约31个标准误差的影响大小。请记住,标准误差通常与的倒数平方根成比例,这反映出小于0.09标准差的差异(假设所有样本都是独立的)。在大多数应用中,这种差异不会有任何可疑或不同寻常的之处。 ñ10303n

解释这样的p值是另一回事。查看一些小甚至的概率超过情理之中,因为所有的方法,使现实中很可能会偏离的概率模型,巩固该P-值计算。一个不错的选择是报告p值小于您认为模型可以合理支持的最小阈值:通常在到之间。 10 10 0.01 0.00011020710100.010.0001


13
当我在会议论文中报告“ ”时,一位审阅者告诉我,我应该将其更改为“ ”,以便遵循APA准则。 p < 0.001p<10-26p<0.001
Thomas Levine

4
@whuber-漂亮地说。
rolando2 2011年

2
(+1)在某些时候,政府更有可能使用超级间谍技术来远程翻转RAM中的位...
JMS

4
(+1)在IEEE双精度浮点数中,实际上可以降至。但是,在此之前,几乎可以保证您计算值的数值程序会崩溃。除非您知道建模假设是完全正确的事实(它们何时是正确的?),否则一旦样本足够大,值最终只会成为样本大小的度量。 p p5×10-324pp
主教

1
@Cardinal我们都错的界限:从非规格化值分开时,最小的IEEE双约为,对应于10比特的基-2-指数。10-308
whuber

16

没有什么可疑的-当样本量很大时(就像您用于比较中位数一样),像p这样的极低p值很常见。如胡夫提到的那样,通常报告这种p值小于某个阈值(例如<0.001)。

要注意的一件事是,p值仅告诉您中位数的差异是否在统计上显着。差异的大小是否足够大是您必须决定的:例如,对于大型样本集,均值/中位数的极小差异可能具有统计学上的显着性,但意义不大。


3

p值可以达到0。

θH0θ=1个X=1.1

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.