我建议将贝叶斯数据分析书作为回答此问题(特别是第6章)以及我将要说的所有内容的重要资料。但是,贝叶斯解决此问题的常用方法之一是使用后验预测P值(PPP)。在介绍PPP如何解决此问题之前,让我先定义以下符号:
令为观测数据,为参数向量。我们将为可以观察到的重复数据,或者,以预测性思考的方式,假设如果今天产生的实验使用相同的模型和相同的条件进行复制,我们将在明天看到这些数据。产生观测数据的值。θ ÿ 代表ÿθÿ代表θÿθ
注意,给定当前知识状态,我们将使用后验预测分布来定义的分布
p (Ý 代表 | Ý )= ∫ Θ p (Ý 代表 | θ )p (θ | Ý )d θÿ代表
p (ÿ代表| ÿ)= ∫Θp (ÿ代表| θ)p(θ | y)dθ
现在,我们可以通过定义测试数量(我们要检查的数据方面)来测量模型与数据之间的差异。的测试量,或差异量度,,是进行比较的数据时,预测模拟被用作一个标准的参数和数据的标摘要。测试数量在贝叶斯模型检查中发挥作用,而测试统计量在经典测试中发挥作用。我们为检验统计量定义符号,检验统计量是仅取决于数据的检验量。在贝叶斯环境中,我们可以推广检验统计量以允许依赖模型参数在其后验分布下的依赖。T (y )Ť(y,θ )Ť(y)
传统上,用于检验统计的p值是
其中概率被取固定了的的分布。Ť(y)
pC= 镨(Ť(y代表)≥ Ť(y)| θ )
ÿ代表θ
从贝叶斯角度来看,数据相对于后验预测分布的不拟合性可以通过测试量的尾部面积概率或p值来衡量,并使用。在贝叶斯方法中,测试量可以是未知参数以及数据的函数,因为测试量是根据未知参数的后验分布进行绘制得出的。(θ ,ÿ代表)
现在,我们可以将贝叶斯p值(PPP)定义为复制的数据可能比观察到的数据更极端的概率,以测试量来衡量:
,其中,概率取于的后验分布和的后验预测分布(即是,联合分布):
其中是指标函数。在实践中,尽管我们通常使用模拟来计算后验预测分布。
p乙= 镨(Ť(y代表,θ )≥ Ť(y,θ )| ÿ)
θÿ代表p (θ ,y代表| ÿ)p乙= ∬Θ一世Ť(y代表,θ )≥ Ť(y| θ)p (ÿ代表| θ)p(θ | y)dÿ代表dθ ,
一世
例如,如果已经有的后验分布进行模拟,则可以从每个模拟的预测分布中得出一个;现在,我们从联合后验分布获得平局。后验检查是已实现的测试量与预测的测试量。估计的p值只是这些模拟中测试量等于或大于其实际值的比例;也就是说,为此θ ÿ 代表 θ 大号p (Ý 代表,θ | ÿ )ţ (Ý ,θ 升)ţ (Ý 代表升,θ 升)大号Ť (Ý 代表升,θ 升)≥ Ť (Ý ,θ 升)升= 1 ,。。。,L大号θÿ代表θ大号p (ÿ代表,θ | ÿ)Ť(y,θ升)Ť(y代表升,θ升)大号
Ť(y代表升,θ升)≥ Ť(y,θ升)
对于。
l = 1 ,。。。,L
与经典方法相比,贝叶斯模型检查不需要特殊的方法来处理“讨厌的参数”。通过使用后验模拟,我们隐式地对模型中的所有参数进行平均。
另外一个来源,安德鲁·盖尔曼(Andrew Gelman)在这里也有关于PPP的很好的论文:http :
//www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf