不合适的先验如何导致正确的后验分布?


22

我们知道,在适当分配优先权的情况下,

PθX=PXθPθPX

PXθPθ

该步骤的通常的理由是,边缘分布XPX,是相对于恒定θ和导出后验分布时可因此被忽略。

但是,如果先验不正确,您如何知道后验分布实际上存在?这个看似循环的论点似乎有些缺失。换句话说,如果我假设后验存在,那么我就会理解如何推导后验的机制,但是我似乎缺少关于为何甚至存在的理论依据。

PS我也认识到,在某些情况下,先验错误会导致后验错误。

Answers:


16

通常我们接受不正确的先验后验如果 存在并且是一个有效的概率分布(即,它在支持上精确地积分到1)。从本质上讲,这可以归结为是有限的。如果是这种情况,那么我们称这个数量并将其接受为我们想要的后验分布。但是,重要的是要注意,这既不是后验分布,也不是条件概率分布(这两个术语在本文中是同义的)。π(θ)

π(Xθ)π(θ)π(X)
π θ | X π(X)=π(Xθ)π(θ)dθπ(θX)

现在,我说过,鉴于上述,我们接受来自不适当先验的“后验”分布。之所以接受它们,是因为先前的仍会在参数空间上为我们提供相对的“分数”。也就是说,比率为我们的分析带来了意义。在某些情况下,我们从不当先验中获得的含义可能无法在适当的先验中获得。这是使用它们的潜在理由。请参阅Sergio的答案,以更彻底地检查出现不当先验的实际动机。π θ 1π(θ)π(θ1)π(θ2)

值得注意的是,这个量确实也具有理想的理论特性,Degroot和Schervishπ(θX)

不正确的先验不是真实的概率分布,但是如果我们假装它们是真实的,则我们将计算后验分布,该后验分布近似于使用适当的共轭先验和先验超参数的极值获得的后验。


您的回答让我有些困惑。您说如果上述是有限的,我们接受后验。这是否意味着如果该积分不是有限的,则后验将不是有限的?另外,您似乎暗示我们在这种情况下使用后验,但这不是真正的分布-是吗?是否没有真正分布的情况?另外,先验比率与之有什么关系?我看不到连接。
本伊丽莎白·沃德

@BenElizabethWard如果存在,则整数必须存在(因此是有限的)。矛盾也成立:如果不存在(是无限的),则不存在。当它存在并且是有效的概率分布时,是概率分布。但是,它不是具有给定数据似然的后验分布。该先验的后验不存在。我们在分析中接受,因为它是近似值。π X π X π θ | X π θ | X π θ π X | θ π θ | X π(θX)π(X)π(X)π(θX)πθXπθπXθπθX

1
@BenElizabethWard该比率用于证明先验信息仍然包含有用的信息,而我们可能无法将该信息加载到适当的先验信息中。我将编辑答案以包括此内容。

2
@jsk不是概率分布,但是后验分布的定义要求是概率分布,因此欺骗性地将称为后验分布当它是概率分布时。Degroot&Schervish说“ ..我们将计算后验分布..”,他们假设您同意“假装他们[不适当的先验]是[适当的先验]”,如引文中先前所述。π θ π θ | X π(θ)π(θ)π(θX

1
为了使您的答案完整而完整,以便将来的读者不必阅读本评论交流,您是否要更新答案?
jsk 2014年

9

有一个“理论的”答案和一个“务实的”答案。

从理论的角度来看,当先验不正确时,后验就不存在了(好吧,请看马修对一个更合理的陈述的回答),但是可以用一个限制形式来近似。

如果数据包含来自伯努利分布且参数为的条件iid样本,并且具有参数和分布,则的后验分布为参数(观察,成功),其平均值为。如果我们在先验参数之前使用不正确的(和虚幻的)beta分布,并假装θ α β θ α + 小号β + ñ - 小号ñ 小号α + 小号/α + β + Ñ α = β = 0 π θ α θ - 11 - θ - 1 θ s - 11 - θ n - sθθαβθα+sβ+ñ-sñsα+s/α+β+ñα=β=0πθθ-1个1个-θ-1个,我们获得与成正比的适当后验,即除常数因子外,带有参数和的beta分布的pdf 。这是参数值和优先级的后验的限制形式(Degroot&Schervish,示例7.3.13)。小号ñ-小号α→交通0β→交通0θs-1个1个-θñ-s-1个snsα0β0

与平均值的正常模式,已知方差,以及为先验分布,如果在现有的精度,,相对于数据精度较小,则后验分布近似为: 即后验分布大约是假设与的常数成比例而产生的σ 2 Ñμ 0τ 2 0θ 1 / τ 2 0 Ñ / σ 2 τ 2 0 = p θ | X Ñθ | ˉ Xσ 2 / Ñ p θ θ ∈ - τ 2 0θσ2N(μ0,τ02)θ1/τ02n/σ2τ02=

p(θx)N(θx¯,σ2/n)
p(θ)θ(,),这不是严格可能的分布,但是当接近时,后验的限制形式确实存在(Gelman等人,第52页)。τ02

从一个“务实”点,时 的任何是,因此,如果 in ,然后。不适当的先验可用于表示似然性较高的区域先验分布的局部行为。通过假设具有足够的近似值,先验遵循以下形式,例如或仅限于p X | θ = 0 p θ p X | θ 0 b ∫ - p X | θ p θ d θ = b 一个 p X |p(xθ)p(θ)=0p(xθ)=0p(θ)p(xθ)0(a,b)b ˚F X = ķ X - ˚F X = ķ X - 1X 0 b θ ù- p(xθ)p(θ)dθ=abp(xθ)p(θ)dθ(a,b)f(x)=k,x(,)f(x)=kx1,x(0,)(a,b),确保它在该范围外尾部适当地为零,我们确保实际使用的先验是正确的(Box和Tiao,第21页)。因此,如果的先验分布是但 是有界的,就好像,即。举一个具体的例子,这就是Stan中发生的情况:如果没有为参数指定先验,则在支持它时会隐式给予一个统一的先验,并将其作为可能性乘以常数的乘积。θU(,)θ ùb p X | θ p θ = p X | θ ķ α p X | θ (a,b)θU(a,b)p(xθ)p(θ)=p(xθ)kp(xθ)


您能从理论上说为什么不存在吗?
jsk

在马修的回答和评论中,我说得比马修还好。
塞尔吉奥2014年

在实用部分中,y是什么?同样在该部分中,某些项应为似然性吗?p X | θ p(θx)p(xθ)
jsk

谢谢。我认为可能还会有一个错误...您编写,但是先验不能依赖。您是说吗? X P θ = ķ θ - 1Pθ=ķX-1个XPθ=ķθ-1个
jsk

对!我已经将它们重新写成Box&Tiao中的公式。我试图选择一种同质的表示法(例如,Gelman使用而不是,DeGroot使用来表示先验和后验等),但是我最终陷入了混乱……谢谢!X ξ yxξ(.
塞尔吉奥

2

但是,如果先验不正确,您如何知道后验分布实际上存在?

后部也可能不合适。如果先验是不适当的,并且可能性是平坦的(因为没有有意义的观察结果),则后验等于先验并且也是不适当的。

通常情况下,您有一些观察结果,通常可能性不平坦,因此后验是正确的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.