我认为这是已经说过的一切的结合。这是非常有趣的数据,我以前从未考虑过像这样的p值分布。如果原假设为真,则p值将是统一的。但是当然,由于已发布的结果,由于许多原因,我们不会看到一致性。
我们之所以进行这项研究,是因为我们希望原假设为假。因此,我们应该经常取得显著成果。
如果原假设只有一半的时间是假的,我们将不会得到p值的均匀分布。
文件抽屉问题:如前所述,如果p值不显着(例如低于0.05),我们将害怕提交论文。
尽管我们选择提交论文,但出版商仍会因为无意义的结果而拒绝该论文。
当结果接近临界点时,我们将做一些事情(也许不是出于恶意)。(a)当p值为0.053时四舍五入为0.05,(b)找到我们认为可能是异常值的观察值,将它们移开后p值将降至0.05以下。
我希望本文以合理的理解的方式总结了一切。
我认为有意思的是,我们看到p值介于0.05和0.1之间。如果发布规则拒绝p值大于0.05的任何内容,则右尾将截断为0.05。它实际上是在0.10截止吗?如果是这样,也许某些作者和某些期刊将接受0.10的显着性水平,但没有更高的水平。
由于许多论文都包含多个p值(是否已针对多重性进行了调整),并且该论文被接受是因为关键测试很重要,所以我们可能会看到列表中包含不重要的p值。这就提出了一个问题:“直方图中是否包含了所有报告的p值?”
另一个观察结果是,随着p值远低于0.05,发表论文的频率呈显着上升趋势。也许这表明作者过度解释了p值,认为p <0.0001更值得发表。我认为作者忽略或没有意识到p值不仅取决于样本量,还取决于效果量的大小。