了解贝叶斯预测分布


9

我正在参加贝叶斯入门课程,但在理解预测分布方面有些困难。我了解它们为什么有用,并且我对定义很熟悉,但是有些事情我不太了解。

1)如何获得新观测向量的正确预测分布

假设我们已经为数据和先前的建立了一个采样模型。假设观测值在给定条件下是独立的。p(yi|θ)p(θ)yiθ

我们已经观察到一些数据,并且将先前的更新为后验。D={y1,y2,...,yk}p(θ)p(θ|D)

如果我们想预测新观测值的向量,我认为我们应该尝试使用此公式获得后验预测 不等于 所以预测的观测值不是独立的,对不对?N={y~1,y~2,...,y~n}

p(N|D)=p(θ|D)p(N|θ)dθ=p(θ|D)i=1np(y~i|θ)dθ,
i=1np(θ|D)p(y~i|θ)dθ,

说 Beta()和 Binomial()固定为。在这种情况下,如果我想模拟6个新的,如果我理解正确,那么独立于与单个观察的后验预测相对应的Beta-Binomial分布独立地模拟6个平局将是错误的。它是否正确?我不知道该如何解释这些观察结果并不是边缘独立的,并且我不确定我是否正确理解了这一点。θ|Da,bp(yi|θ)n,θny~

从后验预测模拟

很多时候,当我们从后验预测中模拟数据时,我们都会遵循以下方案:

对于从1到:bB

1)从采样。θ(b)p(θ|D)

2)然后从模拟新数据。N(b)p(N|θ(b))

尽管它看起来很直观,但我不太知道如何证明该方案的有效性。另外,这有名字吗?我尝试查找理由,并尝试使用其他名称,但是我没有运气。

谢谢!


我在stats.stackexchange.com/questions/72570/上问了类似的问题,但是到目前为止,您的选票似乎获得了更多的票数。
约翰

Answers:


4

假设给定,则是条件独立的。然后, 其中第一个等式来自于总概率定律,第二个等式来自于乘积规则,第三个等价于假定的条件独立性:给定的值X1,,Xn,Xn+1Θ=θ

fXn+1X1,,Xn(xn+1x1,,xn)=fXn+1,ΘX1,,Xn(xn+1,θx1,,xn)dθ
=fXn+1Θ,X1,,Xn(xn+1θ,x1,,xn)fΘX1,,Xn(θx1,,xn)dθ
=fXn+1Θ(xn+1θ)fΘX1,,Xn(θx1,,xn)dθ,
Θ,我们不需要的值即可确定的分布。X1,,XnXn+1

模拟方案是正确的:对于,从的分布中绘制,然后绘制来自。这为您提供了一个示例i=1,,Nθ(i)ΘX1=x1,,Xn=xnxn+1(i)Xn+1Θ=θ(i){xn+1(i)}i=1N从分布Xn+1X1=x1,,Xn=xn


如果您在多个时期获得后验预测该怎么办?我一直在用θ(i) 每个 xn+j,但我明白了为什么重新绘制新的theta可能有意义。
约翰

2

我将尝试逐步了解生成后验预测分布的直觉。

y 是来自概率分布的观测数据的向量 p(y|θ) 然后让 y~是我们要预测的未来(或样本外)值的向量。我们假设y~ 来自与 y。使用我们的最佳估计值可能会很诱人θ---例如MLE或MAP估计---以获得有关此分布的信息。但是,这样做不可避免地会忽略我们对以下方面的不确定性θ。因此,进行的适当方法是对θ,即 p(θ|y)。还要注意y~ 独立于 y 给定 θ,因为它假定是从与 y。从而,

p(y~|θ,y)=p(y~,y|θ)p(θ)p(θ,y)=p(y~|θ)p(y|θ)p(θ)p(y|θ)p(θ)=p(y~|θ).

的后验预测分布 y~ 因此,

p(y~|y)=Θp(y~|θ,y)p(θ|y)dθ=Θp(y~|θ)p(θ|y)dθ

哪里 Θ 是...的支持 θ

现在,我们如何从 p(y~|y)?您描述的方法有时称为组合方法,其工作方式如下:


对于s = 1,2,...,S做

θ(s)p(θ|y)

y~(s)p(y~|θ(s))


在大多数情况下,我们已经从 p(θ|y),因此只需要第二步。

起作用的原因很简单:首先请注意 p(y~,θ|y)=p(y~|θ,y)p(θ|y)。因此,对参数向量进行采样θ(s)p(θ|y) 然后,使用此向量进行采样 y~(s)p(y~|θ(s))=p(y~|θ(s),y) 从联合分布中得出样本 p(y~,θ|y)。因此,采样值y~(s),s=1,2,...,S 是边际分布的样本, p(y~|y)


1

要解决您的第一个问题:是的,如果您不知道观测值的价值,则观察结果不是独立的 θ。说,你观察到y~1具有极高的价值。这可能表明θ 本身是极端的,因此,您应该期望其他观察结果也是极端的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.