如果您已经在应用贝叶斯分析并且不关心统计显着性部分,那么本文的另一个角度将对您有所帮助。
假设是您要估算的(效果大小)的后CDF 。在贝叶斯情况下,以某种自由表示法并切换到谈论概率密度函数,您将有一个基于一些可观察量以及纯先验的似然函数:PβVβ
p(β|V)∼p(V|β)p(β)
这里可能是一个向量,在最简单的情况下是多个独立观察的向量,从中可以得出似然项的通常乘积,变成对数项的总和,等等。该向量的长度为a样本量的参数化。在其他模型中,假设是泊松,则可能会将其汇总到泊松参数中,该参数也表示样本大小的参数化。VVp(V|β)
现在,假设您根据文献综述或其他方法做出了一个假设。您可以将假定的数据生成过程与以生成模拟,这些模拟表示如果模型被正确指定并且是真实的效果大小。βplausibleP(V|β)β=βplausibleVβplausible
然后,您可能会做一些愚蠢的事情:转过身来,像观察到的样本就是观察到的数据,然后从整个后验画出一堆样本。从这些样本中,您可以如本文所述计算统计信息。Vβ
链接纸张中的数量,S型错误和夸张率已经几乎代表了同一件事。对于那个效应大小,给定您的模型选择,这些将告诉您给选择的样本大小的给定参数,错误符号的后验概率是多少,以及效应大小之间的期望(后验)比率是多少当您改变任何方面与样本大小有关时,模型产生的值和假定的合理效果大小。VV
最棘手的部分是将后验“幂”解释为后验概率,即的估计值至少与假设值。这不是衡量否定假设的能力的量度,因为从概率论意义上讲,该概率的大小将不会用作重要量度。ββplausible
我真的不知道该怎么称呼,只是说我在实践中已经有多个应用程序,这是推理研究设计的非常有用的指标。它基本上为您提供了一种方法,以了解关于可能性和先验形状的特定假设以导致“足够高”,需要查看需要提供多少数据(假设您的数据完全是通过使用的过程生成的)。一定大小的效应的后验概率。βplausible
在实践中,这对我最有帮助的地方是需要将相同的通用模型重复应用于不同的数据集,但数据集之间的细微差别可能证明更改先前的分布或使用不同的文献综述子集来证明这一点是合理的确定的实用选择,然后粗略诊断一下针对不同数据集的这些调整是否会导致您需要大量更多数据以使后验具有非平凡概率的情况集中在分布的右侧。βplausible
您必须小心,不要有人滥用此“权力”度量标准,因为它与常客权力计算是同一回事,这很难。但是,即使整个建模过程是贝叶斯方法,并且不会引用任何统计显着性结果,所有这些度量标准对于前瞻性和回顾性设计分析都非常有用。