我一直试图了解贝叶斯统计中的共轭先验的想法,但我只是不明白。谁能用最简单的术语来解释这个想法,也许以“高斯先验”为例?
我一直试图了解贝叶斯统计中的共轭先验的想法,但我只是不明白。谁能用最简单的术语来解释这个想法,也许以“高斯先验”为例?
Answers:
参数的先验几乎总是具有某些特定的功能形式(通常以密度表示)。假设我们将自己限制在一个特定的分布族中,在这种情况下,选择先验会简化为选择该族的参数。
例如,考虑一个正态模型。为了简单起见,让我们也已知。模型的这一部分-数据模型-确定似然函数。
为了完善我们的贝叶斯模型,这里我们需要先验 。
如上所述,通常我们可能会为先前的 ,然后我们只需要选择该分布的参数即可(例如,通常先验信息可能非常含糊-就像我们希望集中概率的大致位置-而不是非常具体的功能形式,并且我们可能有足够的自由通过选择参数来建模所需的模型(例如,匹配先前的均值和方差)。
如果事实证明后验为与前来自同一家族,则称 “共轭”。
(使之成为共轭的是它与可能性结合的方式)
因此,在这种情况下,让我们来高斯先验对于(说μ 〜Ñ (θ ,τ 2))。如果这样做,我们可以看到μ的后验也是高斯的。因此,对于上述模型,高斯先验是共轭先验。
真的就是所有这些-如果后验与前验来自同一个家庭,那么它就是共轭先验。
在简单情况下,您可以通过检查可能性来确定共轭。例如,考虑二项式可能性;除去常数,它看起来像的beta密度;而且由于路权力p和(1 - p )相结合,将乘以一个测试之前,也给权力的产物p和(1 - p ) ......所以我们可以从可能性立即看到在二项式似然中,β将是p的共轭先验。
在高斯情况下,最容易看到这种情况的发生是通过考虑对数密度和对数似然;对数似然将是的二次方,两个二次方之和是二次方,因此二次对数先验+二次对数似然就得出了二次后验(最高阶项的每个系数当然都是负的)。
如果模型属于一个指数族,即,如果所述分布的密度的形式为
主导措施的选择对于先验家庭是决定性的。例如如果一个面临着一个正常均值的可能性为Glen_b的回答,选择勒贝格测度为主导措施导致正常的先验是共轭。相反,如果一个人选择为主导措施,共轭先验是家庭分布的其密度内
在此指数族设置之外,没有任何具有固定支持的非平凡分布族允许共轭先验。这是Darmois-Pitman-Koopman引理的结果。
我喜欢使用发行版的“内核”概念。在这里,您只剩下依赖于参数的零件。一些简单的例子。
正常内核
When we look at the likelihood function, we can do the same thing, and express it in "kernel form". For example with iid data
For some constant and some function . If we can recognise this function as a kernel, then we can create a conjugate prior for that likelihood.
If we take the normal likelihood with unit variance, the above looks like
where and and
This likelihood function has the same kernel as the normal distribution for , so a conjugate prior for this likelihood is also the normal distribution.
In some sense a conjugate prior acts similarly to adding "pseudo data" to the data observed, and then estimating the parameters.
For a given distribution family of the likelihood (e.g. Bernoulli),
if the prior is of the same distribution family as the posterior (e.g. Beta),
then and are conjugate distribution families and the prior is called a conjugate prior for the likelihood function.
Note: