在正态和二项式模型中,后验方差是否总是小于先验方差?


10

或什么条件可以保证?总的来说(不仅是正常模型和二项式模型),我认为打破这一主张的主要原因是采样模型与先验模型之间存在不一致,但是还有什么呢?我从这个话题开始,所以我非常喜欢简单的例子

Answers:


9

由于的后验和先验方差满足(用表示样本) 假设所有数量都存在,则可以期望后验方差平均较小(以)。当后验方差在恒定时,尤其如此。但是,如另一个答案所示,由于结果仅符合预期,因此后验方差的实现可能会更大。X VAR θ = È [ 变种θ | X ] + VAR é [ θ | X ] X XθX

var(θ)=E[var(θ|X)]+var(E[θ|X])
XX

引用安德鲁·盖尔曼(Andrew Gelman)的话,

我们在贝叶斯数据分析Bayesian Data Analysis)的第2章中对此进行了考虑,我认为其中有一些作业问题。简短的答案是,可以预期,随着获得更多信息,后方方差会减少,但是根据模型的不同,在某些情况下方差会增加。对于正常和二项式等模型,后方方差只能减小。但是请考虑自由度较低的t模型(可以将其解释为具有共同均值和不同方差的法线的混合)。如果您观察到一个极值,则表明方差很高,并且后方方差确实会增加。


@Xian,您能看看我的“答案”,这似乎与您的矛盾吗?如果Gelman和您说出贝叶斯统计数据,那么我比我更愿意信任您……
Christoph Hanck

1
我们的答案之间没有冲突。BDA中甚至有一个与您的示例相对应的练习,即查找将Beta后方方差设置为大于先前方差的数据。
西安

一个有趣的后续问题是:保证样本量增加时方差收敛到0的条件是什么?
朱利安

8

对于@西安,这将是更多的问题,而不是答案。

我要回答的是后差 其中个试验次数,个成功次数,是先验beta的系数,超过先验方差 根据下面的示例,在二项式模型中也可以使用先验形成鲜明对比,因此后验“在两者之间太远”。它似乎与Gelman的报价相矛盾。Ñķα0β0Vθ=α 0 β0

V(θ|y)=α1β1(α1+β1)2(α1+β1+1)=(α0+k)(nk+β0)(α0+n+β0)2(α0+n+β0+1),
nkα0,β0
V(θ)=α0β0(α0+β0)2(α0+β0+1)
n <- 10         
k <- 1
alpha0 <- 100
beta0 <- 20

theta <- seq(0.01,0.99,by=0.005)
likelihood <- theta^k*(1-theta)^(n-k) 
prior <- function(theta,alpha0,beta0) return(dbeta(theta,alpha0,beta0))
posterior <- dbeta(theta,alpha0+k,beta0+n-k)

plot(theta,likelihood,type="l",ylab="density",col="lightblue",lwd=2)

likelihood_scaled <- dbeta(theta,k+1,n-k+1)
plot(theta,likelihood_scaled,type="l",ylim=c(0,max(c(likelihood_scaled,posterior,prior(theta,alpha0,beta0)))),ylab="density",col="lightblue",lwd=2)
lines(theta,prior(theta,alpha0,beta0),lty=2,col="gold",lwd=2)
lines(theta,posterior,lty=3,col="darkgreen",lwd=2)
legend("top",c("Likelihood","Prior","Posterior"),lty=c(1,2,3),lwd=2,col=c("lightblue","gold","darkgreen"))

 > (postvariance <- (alpha0+k)*(n-k+beta0)/((alpha0+n+beta0)^2*(alpha0+n+beta0+1)))
[1] 0.001323005
> (priorvariance <- (alpha0*beta0)/((alpha0+beta0)^2*(alpha0+beta0+1)))
[1] 0.001147842

因此,该示例表明在二项式模型中存在较大的后验方差。

当然,这不是预期的后验方差。那是差异所在吗?

对应的图是

在此处输入图片说明


4
完美的例证。而且,实现的后验方差大于先验方差且期望值较小的事实之间没有差异。
西安

1
我提供了一个指向该答案的链接,作为此处也正在讨论的一个很好的例子。这个结果(随着数据的收集,方差有时会增加)扩展到了熵。
Don Slowik
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.