贝叶斯统计中是否需要进行功率分析?


19

我最近一直在研究经典统计的贝叶斯方法。在阅读了有关贝叶斯因子的信息后,我一直想知道从这种统计角度来看是否需要进行功效分析。我想知道这是贝叶斯因子的主要原因,实际上似乎只是似然比。一旦达到25:1,就好像我可以称之为一个夜晚。

我远吗?我还能做其他阅读以了解更多信息吗?当前正在阅读这本书:WM Bolstad 撰写的 “贝叶斯统计简介”(Wiley-Interscience;第二版,2007年)。



Answers:


10

在将来的研究中,功效与p <0.05α的长期可能性有关。在贝叶斯中,研究A的证据直接进入研究B的先验,等等。因此,频率统计中定义的权力实际上并不存在。


12
权力的有限视角将其视为0-1损失函数的风险曲线的表示。贝叶斯分析将风险组合在先验概率之上。但是,好的贝叶斯分析考虑了其结果对选择先验分布的敏感性。这似乎使我们回到了功率分析领域。尽管它可能不是用这个名称命名的,但计算方法有所不同,但目的是相同的:即,确定要获取的样本量,以合理确定是否满足研究目标。
whuber

2
这是Whuber的一个很好的观点。但是,这不是进行功效计算的唯一原因,许多贝叶斯主义者会认为这是不必要的,因为您无需事先确定N(错误)。
约翰

5
ñ

2
我没有想到这个主意,有许多论文表明贝叶斯主义者认为您可以添加主题,直到您有足够的证据做出决定为止,而频繁测试则无法进行此类测试和添加程序。我可以查询一下我认为的参考资料。最值得注意的是,这提出了如何在临床试验中分析数据的提议。
约翰

8
显然,当人们可以以这种顺序的方式进行操作时,有充分的理由这样做。但是,即使如此,也并不意味着估计ñ是“不必要的”!我什至可以相信存在这样一个论点的人的存在,但是我不得不认为他们是对现实实验或数据收集不感兴趣的超凡脱俗的生物!
whuber

14

您可以使用贝叶斯统计量执行假设检验。例如,如果超过95%的后验密度大于零,则可以得出结论,效应大于零。或者,您可以根据贝叶斯因素采用某种形式的二元决策。

一旦建立了这样的决策系统,就可以假设给定的数据生成过程和样本量来评估统计能力。您可以使用仿真轻松地在给定的上下文中对此进行评估。

就是说,贝叶斯方法通常更关注可信度区间,而不是点估计,置信度而不是二元决策。使用这种更连续的推理方法,您可以评估对设计推理的其他影响。特别是,对于给定的数据生成过程和样本量,您可能需要评估可信区间的预期大小。


3

这个问题导致很多误解,因为人们使用贝叶斯统计数据来问一些常问问题。例如,人们想确定变体B是否比变体A好。他们可以通过确定两个后验分布(BA)之间差异的95%最高密度区间是否大于0或a来用贝叶斯统计量回答这个问题。具有实际意义的区域大约为0。但是,如果您使用贝叶斯统计来回答常客问题,您仍然会犯常客错误:类型I(误报; opps-B实际上并不更好)和类型II(未命中;无法实现) B确实更好)。

功效分析的重点是减少II型错误(例如,至少有80%的机会发现效果,如果存在的话)。当使用贝叶斯统计量来问像上述问题之类的常问问题时,也应使用功效分析。

如果您不使用功耗分析,然后在收集数据时反复查看数据,然后仅在发现明显差异时才停止,那么您将产生比预期更多的I类(错误警报)错误-就像您一直在使用常客统计一样。

查看:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

值得注意的是,某些贝叶斯方法可以减少但不能消除发生I型错误的可能性(例如,适当的先验信息)。


0

例如,在临床试验中需要进行功效分析,以便能够计算/估计要招募多少名参与者,以便有机会发现(给定的最小尺寸)治疗效果(如果存在)。招募无数的患者是不可行的,首先是由于时间限制,其次是由于成本限制。

因此,想象一下我们正在采用贝叶斯方法进行所述临床试验。尽管从理论上讲可以使用统一的先验,但是无论如何还是建议对先验敏感,因为不幸的是,可以使用多个统一的先验(我现在想这很奇怪,因为实际上只有一种表达完全不确定性的方法)。

因此,想象一下,进一步,我们将进行敏感性分析(此处不仅要对模型进行评估,而不仅仅是对模型进行审查)。这涉及从合理的模型中模拟“真相”。在古典/频率统计中,这里有“真相”的四个候选:H0,mu = 0; H1,mu!= 0,其中观察到有错误(如在我们的真实世界中)或无错误(如在不可观察的现实世界中)。在贝叶斯统计中,这里有两个“真相”候选者:mu是一个随机变量(就像在不可观察的现实世界中一样);mu是随机变量(从不确定的个体的角度来看,就像在我们可观察的现实世界中一样)。

因此,实际上,这取决于您要尝试通过试验说服A)还是通过敏感性分析说服B)。如果不是同一个人,那将很奇怪。

真正要讨论的是关于什么是真相以及证实了有形证据的共识。共同点是,在我们的实际可观察​​世界中可以观察到签名概率分布,这些分布在某种程度上显然具有一些潜在的数学真理,而这恰巧是偶然的或设计的。我将停在这里,因为这不是艺术页面,而是科学页面,或者这是我的理解。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.