允许数据决定先验条件,然后使用这些先验条件运行模型?(例如,来自同一数据集的数据驱动先验)


9

我的理解是,我们不应该允许我们正在分析的同一数据集来驱动/定义贝叶斯分析中的先验分布。特别是,基于来自同一数据集的摘要统计信息来定义贝叶斯分析的先验分布是不合适的,然后您将使用先验来帮助模型拟合。

有谁碰巧知道专门讨论这是不合适的资源?我需要对此问题进行一些引用。


Answers:


11

是的,这是不合适的,因为它两次使用相同的数据,从而导致错误的过分自信的结果。这就是所谓的“双浸”。

作为参考,我将从Carlin和Louis(2000)开始。尽管“双底”一直是贝叶斯经验主义的主要批评之一。本书第3节(特别是第3.5节)介绍了使用EB方法估算适当置信区间的方法。

Berger J(2006)。\客观贝叶斯分析的情况。“贝叶斯分析,1(3),385 {402

Bradley P. Carlin,Thomas A. Louis2000。数据分析的贝叶斯和经验贝叶斯方法。

Darniede,WF,2011年。数据相关先验的贝叶斯方法。俄亥俄州立大学硕士论文。

Gelman,A.,Carlin,JB,Stern,HS,and Rubin,DB(2003),贝叶斯数据分析,第二版(查普曼和霍尔/ CRC统计学中的文本),查普曼和霍尔/ CRC,第二版ed。


@sarah请注册您的帐户,以便您提出问题。只需访问以下网址:stats.stackexchange.com/users/login

1

不过,使用数据来构建先验是有意义的。

有关混合建模的示例,请参见Richardson&Green(1997):http : //citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.3667

他们使用数据点的均值和范围作为先验的超参数,这很有意义。

在我看来,当从数据中获得信息丰富的先验信息时,就会出现两次使用数据的问题。

只要您检查后验分布达到峰值的先验分布是“平坦的”,就可以知道您的先验分布对结果没有很大的影响。


在贝叶斯范式中不能使用数据来建立先验。因此,从贝叶斯的角度来看这是没有意义的,并且贝叶斯过程的通常验证不适用。得出的推论可能是完全正确的,但必须从第一原理中进行证明。(Richardson和Green使用称为经验贝叶斯的方法。这不是贝叶斯方法。)
西安

尽管在贝叶斯范式中没有意义,但有时很难区分数据是什么和先验是什么。请参阅我对stats.stackexchange.com/questions/112451/…的
kjetil b halvorsen
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.