我最近一直在研究经典统计的贝叶斯方法。在阅读了有关贝叶斯因子的信息后,我一直想知道从这种统计角度来看是否需要进行功效分析。我想知道这是贝叶斯因子的主要原因,实际上似乎只是似然比。一旦达到25:1,就好像我可以称之为一个夜晚。
我远吗?我还能做其他阅读以了解更多信息吗?当前正在阅读这本书:WM Bolstad 撰写的 “贝叶斯统计简介”(Wiley-Interscience;第二版,2007年)。
我最近一直在研究经典统计的贝叶斯方法。在阅读了有关贝叶斯因子的信息后,我一直想知道从这种统计角度来看是否需要进行功效分析。我想知道这是贝叶斯因子的主要原因,实际上似乎只是似然比。一旦达到25:1,就好像我可以称之为一个夜晚。
我远吗?我还能做其他阅读以了解更多信息吗?当前正在阅读这本书:WM Bolstad 撰写的 “贝叶斯统计简介”(Wiley-Interscience;第二版,2007年)。
Answers:
在将来的研究中,功效与p <0.05α的长期可能性有关。在贝叶斯中,研究A的证据直接进入研究B的先验,等等。因此,频率统计中定义的权力实际上并不存在。
这个问题导致很多误解,因为人们使用贝叶斯统计数据来问一些常问问题。例如,人们想确定变体B是否比变体A好。他们可以通过确定两个后验分布(BA)之间差异的95%最高密度区间是否大于0或a来用贝叶斯统计量回答这个问题。具有实际意义的区域大约为0。但是,如果您使用贝叶斯统计来回答常客问题,您仍然会犯常客错误:类型I(误报; opps-B实际上并不更好)和类型II(未命中;无法实现) B确实更好)。
功效分析的重点是减少II型错误(例如,至少有80%的机会发现效果,如果存在的话)。当使用贝叶斯统计量来问像上述问题之类的常问问题时,也应使用功效分析。
如果您不使用功耗分析,然后在收集数据时反复查看数据,然后仅在发现明显差异时才停止,那么您将产生比预期更多的I类(错误警报)错误-就像您一直在使用常客统计一样。
查看:
https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html
http://varianceexplained.org/r/bayesian-ab-testing/
值得注意的是,某些贝叶斯方法可以减少但不能消除发生I型错误的可能性(例如,适当的先验信息)。
例如,在临床试验中需要进行功效分析,以便能够计算/估计要招募多少名参与者,以便有机会发现(给定的最小尺寸)治疗效果(如果存在)。招募无数的患者是不可行的,首先是由于时间限制,其次是由于成本限制。
因此,想象一下我们正在采用贝叶斯方法进行所述临床试验。尽管从理论上讲可以使用统一的先验,但是无论如何还是建议对先验敏感,因为不幸的是,可以使用多个统一的先验(我现在想这很奇怪,因为实际上只有一种表达完全不确定性的方法)。
因此,想象一下,进一步,我们将进行敏感性分析(此处不仅要对模型进行评估,而不仅仅是对模型进行审查)。这涉及从合理的模型中模拟“真相”。在古典/频率统计中,这里有“真相”的四个候选:H0,mu = 0; H1,mu!= 0,其中观察到有错误(如在我们的真实世界中)或无错误(如在不可观察的现实世界中)。在贝叶斯统计中,这里有两个“真相”候选者:mu是一个随机变量(就像在不可观察的现实世界中一样);mu是随机变量(从不确定的个体的角度来看,就像在我们可观察的现实世界中一样)。
因此,实际上,这取决于您要尝试通过试验说服A)还是通过敏感性分析说服B)。如果不是同一个人,那将很奇怪。
真正要讨论的是关于什么是真相以及证实了有形证据的共识。共同点是,在我们的实际可观察世界中可以观察到签名概率分布,这些分布在某种程度上显然具有一些潜在的数学真理,而这恰巧是偶然的或设计的。我将停在这里,因为这不是艺术页面,而是科学页面,或者这是我的理解。