贝叶斯(Bayesian)和基准(Fiducial)有两种尝试完全按照您在统计历史中所说的做。RA Fisher创立了两个统计思维学派,即以最大可能性法和基准法为基础的似然法学派,以失败告终,但它试图完全按照自己的意愿去做。
关于它为什么失败的简短答案是它的概率分布最终没有整合为一体。最后的教训是,先验概率是必须创建要尝试创建的东西的必要条件。的确,您正沿着历史上最伟大的统计学家之一的道路前进,而其他许多伟大的伟大人物也死了,希望能解决这个问题。如果找到,就可以将零假设方法与贝叶斯方法放在同等程度上,将其视为可以解决的问题的类型。的确,除非存在真正的先验信息,否则它将超越贝叶斯。
您还需要注意,p值表示替代方法的可能性更高。这仅在渔夫似然学校中才是正确的。在皮尔逊-奈曼(Pearson-Neyman)频率派学校中,这根本不是真的。您底部的赌注似乎是Pearson-Neyman赌注,而您的p值不兼容,因为它来自Fisherian学校。
出于慈善目的,我将假设您的示例不存在出版偏见,因此在期刊中仅出现显着结果,从而导致较高的虚假发现率。我将其视为所有研究的随机样本,无论结果如何。我认为您的投注赔率在古典的de Finetti这个词意义上是不一致的。
在de Finetti的世界中,如果赌徒不能被玩家玩,那么赌注是连贯的,因此他们肯定会输掉。在最简单的结构中,就像解决切蛋糕的问题一样。一个人将一块切成两半,而另一个人选择他们想要的一块。在这种结构中,一个人会在每个假设上说明下注的价格,但另一人会选择购买或出售该下注。本质上,您可以卖空。为了达到最佳,赔率必须严格公平。P值不会导致公平的赔率。
为了说明这一点,请考虑Wetzels等人的研究,网址为http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf
被引用为:Ruud Wetzels,Dora Matzke,Michael D. Lee,Jeffrey N. Rounder,Geoffrey J. Iverson和Eric-Jan Wagenmakers。实验心理学的统计证据:使用855 t检验的经验比较。心理科学观点。6(3)291-298。2011年
这是对使用Bayes因子绕过先验分布问题的855个t检验的直接比较。在.05和.01之间的p值的70%中,贝叶斯因子充其量是轶事。这是由于频繁使用的数学形式来解决问题。
空假设方法假定模型是真实的,并且通过构造使用最小极大统计分布而不是概率分布。这两个因素都会影响贝叶斯解决方案与非贝叶斯解决方案之间的差异。考虑一项研究,其中贝叶斯方法将假设的后验概率评估为3%。想象一下,p值小于5%。两者都是正确的,因为百分之三小于百分之五。但是,p值不是概率。它仅说明最大值,该最大值可能是查看数据的概率,而不是假设为真或为假的实际概率。的确,在p值构造下,您无法区分由于偶然带来的影响,即带有真null的机会和带有良好数据的false null。
如果您查看Wetzel研究,您会注意到,很明显p值所隐含的几率与贝叶斯度量所隐含的几率不匹配。由于贝叶斯度量既是可容许的又是连贯的,而非贝叶斯的度量不是连贯的,因此假设p值映射到真实概率是不安全的。强制假定null为有效将提供不错的覆盖率,但不会产生不错的赌博机率。
为了更好地理解原因,请考虑考克斯的第一个公理,即假设的真实性可以用实数描述。隐含地,这意味着所有假设都有与其真实性相关的实数。在零假设方法中,只有零具有与真实性相关的实数。替代假设没有进行度量,并且在无效为真的情况下,它当然不是观察数据概率的补充。确实,如果null为true,则补全在不考虑数据的前提下为false。
如果您使用p值作为测量的基础来构建概率,那么使用贝叶斯测量的贝叶斯方法将始终能够比您获得优势。如果贝叶斯定下赔率,则皮尔森和内曼决策理论将提供下注或不下注的陈述,但他们将无法定义下注的金额。由于贝叶斯赔率是公平的,因此使用Pearson和Neyman方法的预期收益将为零。
确实,Wetzel研究确实是您正在谈论的事情,但减少了145次下注。如果看表三,您会看到一些研究,其中频发主义者拒绝零值,但是贝叶斯方法发现概率偏爱零值。