一般拟合优度的贝叶斯等效项是什么?


25

我有两个数据集,一个来自一组物理观测值(温度),另一个来自一组数值模型。我正在做一个完美模型分析,假设模型集合表示一个真实的独立样本,并检查是否从该分布中得出观察结果。我计算出的统计数据已归一化,理论上应为标准正态分布。当然,它并不完美,所以我想测试一下贴合度。

使用常识性推理,我可以计算Cramér-vonMises统计信息(或Kolmogorov-Smirnov等)或类似数据,并在表中查找该值以获得p值,以帮助我确定该值不太可能看到的是,给定的观察结果与模型相同。

该过程的贝叶斯等效项是什么?也就是说,如何量化我对这两个分布(我的计算统计量和标准正态分布)不同的信念的强度?


这样的事情可能符合要求。
Cyan 2013年

Answers:


23

我建议将贝叶斯数据分析书作为回答此问题(特别是第6章)以及我将要说的所有内容的重要资料。但是,贝叶斯解决此问题的常用方法之一是使用后验预测P值(PPP)。在介绍PPP如何解决此问题之前,让我先定义以下符号:

令为观测数据,为参数向量。我们将为可以观察到的重复数据,或者,以预测性思考的方式,假设如果今天产生的实验使用相同的模型和相同的条件进行复制,我们将在明天看到这些数据。产生观测数据的值。θ ÿ 代表yθÿ代表θÿθ

注意,给定当前知识状态,我们将使用后验预测分布来定义的分布 p Ý 代表 | Ý = ∫ Θ p Ý 代表 | θ p θ | Ý d θÿ代表

pÿ代表|ÿ=Θpÿ代表|θpθ|ÿdθ

现在,我们可以通过定义测试数量(我们要检查的数据方面)来测量模型与数据之间的差异。的测试量,或差异量度,,是进行比较的数据时,预测模拟被用作一个标准的参数和数据的标摘要。测试数量在贝叶斯模型检查中发挥作用,而测试统计量在经典测试中发挥作用。我们为检验统计量定义符号,检验统计量是仅取决于数据的检验量。在贝叶斯环境中,我们可以推广检验统计量以允许依赖模型参数在其后验分布下的依赖。T y ŤÿθŤÿ

传统上,用于检验统计的p值是 其中概率被取固定了的的分布。Ťÿ

pC=Ťÿ代表Ťÿ|θ
ÿ代表θ

从贝叶斯角度来看,数据相对于后验预测分布的不拟合性可以通过测试量的尾部面积概率或p值来衡量,并使用。在贝叶斯方法中,测试量可以是未知参数以及数据的函数,因为测试量是根据未知参数的后验分布进行绘制得出的。θÿ代表

现在,我们可以将贝叶斯p值(PPP)定义为复制的数据可能比观察到的数据更极端的概率,以测试量来衡量: ,其中,概率取于的后验分布和的后验预测分布(即是,联合分布): 其中是指标函数。在实践中,尽管我们通常使用模拟来计算后验预测分布。

p=Ťÿ代表θŤÿθ|ÿ
θÿ代表pθÿ代表|ÿ
p=Θ一世Ťÿ代表θŤÿ|θpÿ代表|θpθ|ÿdÿ代表dθ
一世

例如,如果已经有的后验分布进行模拟,则可以从每个模拟的预测分布中得出一个;现在,我们从联合后验分布获得平局。后验检查是已实现的测试量与预测的测试量。估计的p值只是这些模拟中测试量等于或大于其实际值的比例;也就是说,为此θ ÿ 代表 θ 大号p Ý 代表θ | ÿ ţ Ý θ ţ Ý 代表θ 大号Ť Ý 代表θ Ť Ý θ = 1 L大号θÿ代表θ大号pÿ代表θ|ÿŤÿθŤÿ代表θ大号

Ťÿ代表θŤÿθ
对于。 =1个大号

与经典方法相比,贝叶斯模型检查不需要特殊的方法来处理“讨厌的参数”。通过使用后验模拟,我们隐式地对模型中的所有参数进行平均。

另外一个来源,安德鲁·盖尔曼(Andrew Gelman)在这里也有关于PPP的很好的论文:http : //www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf


3

一种相对简单的可能性:拟合优度的平滑测试,例如 [1]-用正交多项式建立的相对于零值的平滑偏差来构架替代方案(相对于零值密度作为权重函数)相对容易由于多项式的系数形成了null的灵活但参数扩展,因此可以继续使用贝叶斯框架。

[1]:Rayner,JCW和DJ Best(1990),
“拟合优度的平滑检验:概述”,《
国际统计评论》58:1(4月),第9-17页。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.