编辑:我添加了一个简单的示例:的均值的推断。我还稍微澄清了为什么不匹配置信区间的可信区间是不好的。
我是一位虔诚的贝叶斯主义者,正处于某种信仰危机之中。
我的问题如下。假设我要分析一些IID数据。我要做的是:
首先,提出一个条件模型:
然后,选择的先验值:
最后,应用贝叶斯法则,计算后验:(或者应该近似计算,如果它不能计算),并回答我对所有疑问
这是一个明智的方法:如果数据的真实模型确实在我的条件的“内部”(它对应于某个值),那么我可以呼吁统计决策理论说我的方法是可以接受的(请参阅Robert's有关详细信息,请参见“贝叶斯选择”;在所有相关章节中,“所有统计信息”也有明确说明。
但是,众所周知,假设我的模型正确无比:为什么自然应该整洁地落入我所考虑的模型的框内?假设对于所有值,数据的实模型与不同,这要现实得多。通常将其称为“错误指定”模型。p (X | θ )θ
我的问题是,在这种更为现实的,错误指定的情况下,与贝叶斯计算(即计算后验分布)相比,对于简单地计算最大似然估计器(MLE),我没有任何好的论据:
实际上,根据Kleijn,vd Vaart(2012)的说法,在错误指定的情况下,后验分布为:
收敛为到以为中心的狄拉克分布θ中号大号
没有正确的方差(除非两个值恰好相同),以确保后验的可信区间匹配置信区间。(请注意,虽然置信区间显然是贝叶斯人不太在意的事情,但从质量上讲,这意味着后验分布本质上是错误的,因为这意味着其可信区间没有正确的覆盖范围)
因此,我们为没有额外的属性而付出了计算上的额外费用(一般来说,贝叶斯推断要比MLE昂贵)
因此,最后,我的问题是:在模型指定不正确的情况下,是否有关于理论上或经验上的论据,用于对简单的MLE替代方法使用贝叶斯推理?
(由于我知道我的问题通常不清楚,如果您不了解某些内容,请告诉我:我会尝试重新表述)
编辑:让我们考虑一个简单的示例:在高斯模型下推断的平均值(已知方差可以进一步简化)。我们考虑高斯先验:我们将表示为先验均值,表示的逆方差。令为的经验均值。最后,请注意:。 σ μ 0 β 0 ˉ X X 我 μ = (β 0 μ 0 + Ñ
后验分布为:
在正确指定的情况下(当实际上具有高斯分布时),此后验具有以下良好的属性
如果是从分层模型中生成的,在该模型中从先验分布中选择了它们的均值,则后可信区间将具有准确的覆盖范围。以数据为条件,在任何间隔中的概率等于后验归因于该间隔的概率 θ
即使先验值不正确,可信区间也会在极限范围内具有正确的覆盖范围,其中先验对后验的影响将消失
后验进一步具有良好的频度性质:保证从后验构造的任何贝叶斯估计量都是可以接受的,后验均值是均值的有效估计量(在Cramer-Rao意义上),可信区间渐近是置信区间。
在错误指定的情况下,理论上不能保证大多数这些属性。为了修正想法,让我们假设的实际模型是学生分布。我们唯一可以保证的属性(Kleijn等人)是,后验分布集中在极限均值上。通常,所有coverage属性都将消失。更糟糕的是,总的来说,我们可以保证在该限制内,覆盖范围属性从根本上是错误的:后验分布将错误的概率归因于空间的各个区域。X i n → ∞