其中大部分是背景知识,如果您已经对Dirichlet过程混合物有足够的了解,请跳到最后。假设我正在建模来自Dirichlet进程混合的某些数据,即让并以条件假定F∼D(αH)F
Yi∼iid∫f(y|θ)F(dθ).
这里和是现有基础量度。事实证明,如果对于每个观测,如果我知道相关的潜伏,则此模型中的可能性为,其中是的不同值的数量(随机度量几乎肯定是离散的)。Escobar和West开发了以下使用Gamma优先级对进行采样的方案;首先,他们写α>0αHYiθiα
L(α|t)∝αtΓ(α)Γ(α+n)
tθiFαπ(α|t)∝π(α)αtΓ(α)Γ(α+n)∝π(α)αt−1(α+n)B(α+1,n)=π(α)αt−1(α+n)∫10xα(1−x)n−1 dx,
其中是beta函数。然后注意,如果我们引入一个潜在参数则似然具有混合Gamma分布的形式,并用它来写下Gibbs采样器。
B(⋅,⋅)X∼Beta(α+1,n)
现在我的问题。为什么我们不能只写
而不是混合使用Gamma分布,而是使用单个Gamma分布?如果我们引入我是否应该能够做同样的事情而又不需要使用混合物?
L(α|t)∝αtΓ(α)Γ(α+n)=αtΓ(n)Γ(α)Γ(α+n)Γ(n)=αtB(α,n)Γ(n)∝αt∫10xα−1(1−x)n−1 dx,
X∼Beta(α,n)
编辑更多详细信息更多详细信息:为了填补一些空白,Escobar和West中的论点是,让具有形状为且均值为的Gamma分布,因此我们可以介绍一个潜在的使得全条件句是分配为和A的混合物和一αaa/b
π(α|t)∝αa+t−2(α+n)e−bα∫10xα(1−x)n−1 dx
Xπ(α,x|t)∝αa+t−2(α+n)e−bαxα(1−x)n−1.
Beta(α+1,n)XG(a+t,b−log(x))G(a+t−1,b−log(x))为。
α
由相同的参数,我得到了相同的结果,但与用于和为。对我来说,这似乎更容易。他们为什么不这样做呢?Beta(α,n)XG(a+t,b−log(x))α