样本量与先验对后验的影响之间有什么关系?


17

如果我们的样本量较小,那么先验分布会极大地影响后验分布吗?


5
直觉很明显:您拥有的数据越多,您对先验数据的依赖就越少。不仅是统计课程,还是生活课程!;)
Lucas Reis 2012年

Answers:


27

是。在给定数据集X的情况下,参数的后验分布可写为θX

p(θ|X)p(X|θ)likelihoodp(θ)prior

或者,如通常在对数刻度上显示的那样,

log(p(θ|X))=c+L(θ;X)+log(p(θ))

对数似然,与样品大小尺度,因为它是数据的功能,而现有密度没有。因此,随着样本量的增加,L θ ; X的绝对值变大,而log p θ 保持固定(对于θ的固定值),因此总和L θ ; XL(θ;X)=log(p(X|θ))L(θ;X)log(p(θ))θ随着样本大小的增加, + log p θ L θ ; X)的影响更大。L(θ;X)+log(p(θ))L(θ;X)

因此,直接回答您的问题-先验分布变得越来越不相关,因为它被可能性所抵消。因此,对于较小的样本量,先验分布起着更大的作用。这符合直觉,因为您希望当没有足够的数据来证明它们时,先前的规范将发挥更大的作用,而如果样本量很大,则数据中存在的信号将超过任何先验的信念被放入模型中。


6
+1请注意,也取决于ncn

20

这是尝试说明Macro出色(+1)答案的最后一段。它示出了两个先验的参数Ñ ø Ñ p 分布。对于几个不同的n,当观察到x = n / 2时,显示后验分布。如Ñ增长,两者后验变得周围越来越浓缩1 / 2pBinomial(n,p)nx=n/2n1/2

对于n=2,差异很大,但对于,实际上没有差异。n=50

下面的两个是先验(黑色)和Ë 一个2 2 (红色)。后代的颜色与它们的先验颜色相同。Beta(1/2,1/2)Beta(2,2)

Posterior distributions

(请注意,对于许多其他模型和其他先验模型,对于先验无关紧要是不够的!)n=50


4
非常棒的插图,@MånsT。我在您的答案中对“ Beta”和“ Binomial”一词进行了斜体显示-希望您不要介意。
2012年

当然不是,@ Macro!我同意这样看起来更好。
MånsT
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.