为什么Dirichlet分布优先于多项式分布?


Answers:


60

狄利克雷分布现有共轭的多项分布。这意味着,如果多项式参数的先验分布是Dirichlet,则后验分布也是Dirichlet分布(参数与先验分布不同)。这样做的好处是(a)后验分布易于计算,并且(b)在某种意义上可以量化在收集数据后我们的信念发生了多少变化。

当然,可以讨论是否这些是选择特定先验的好理由,因为这些标准与实际先验信念无关。但是,共轭先验很受欢迎,因为出于上述原因,它们通常相当灵活且易于使用。

对于多项式分布的特殊情况,令为多项式参数的向量(即不同类别的概率)。如果p 1... p ķ狄利克雷α 1... α ķ收集数据,然后,给定观测之前X 1... X ķ在不同的类别, p1个pķ

p1个pķDirichletα1个αķ
X1个Xķ
p1个pķ|X1个XķDirichletα1个+X1个αķ+Xķ

α1个=α2==αķ=1个α1个==αķ=1个/2


因此,我们选择Dirichlet分配以获得这些好处。
ColinBinWang 2012年

1
+1:您可能要明确地说似然性一定是Dirichlet,这就是为什么后验分布易于计算的原因。
尼尔·G

18

除了与MånsT的答案相矛盾之外,我只是指出贝叶斯建模中不存在“先验”之类的东西!Dirichlet分布是一种方便的选择,因为(a)共轭,(b)计算,以及(c)与非参数统计的联系(因为这是Dirichlet过程的离散版本)。

但是,(i)在多项式权重上施加的优先级在主观贝叶斯水平上都是合理的答案,并且(ii)在获得先验信息的情况下,没有理由将其简化为Dirichlet分布。还要注意,Dirichlet分布的混合和卷积可以用作先验。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.