(此答案使用您提供的第二个链接。)
回忆一下可能性的定义:
其中在我们的情况下θ = (θ 甲,θ 乙)是用于概率估计该硬币A和B分别地磁头,X = (X 1,... ,X 5)是我们的实验的结果,各
L[θ|X]=Pr[X|θ]=∑ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,…,X5)由10次翻转组成,并且
Z = (Z 1,… ,Z 5)
是每个实验中使用的硬币。
X一世ž= (Z1个,… ,Z5)
我们要找到最大似然估计θ。的期望最大化(EM)算法是找到(至少局部)一种这样的方法θ。它通过找到条件期望来工作,然后将其用于最大化θ。这个想法是通过
在每次迭代中不断寻找一个更可能(即更可能)的θ,我们将不断增加Pr [ X ,Z | θ ]继而增加似然函数。在继续设计基于EM的算法之前,需要完成三件事。θ^θ^θθ镨[ X,Z| θ]
- 建立模型
- 在模型下计算条件期望(电子步)
- 通过更新当前对估计来最大化我们的可能性(M步)θ
构造模型
在继续使用EM之前,我们需要弄清楚我们正在计算的是什么。在E步中,我们正在精确计算的期望值。θ ]。那么,这个值到底是什么?观察该
日志Pr [ X ,Z | θ ]日志镨[ X,Z| θ]
原因是我们要进行5个实验,而且我们不知道每个实验都使用了哪种硬币。不等式是由于对数是凹面的并且应用了Jensen的不等式。我们需要下限的原因是我们无法直接计算原始方程式的arg max。但是,我们可以计算出最终的下限。
日志镨[ X,Z| θ]= ∑我= 15日志∑C∈ { A ,B }镨[ X一世,Z一世= C| θ]= ∑我= 15日志∑C∈ { A ,B }镨[ ž一世= C| X一世,θ ] ⋅ 镨[ X一世,Z一世= C| θ]镨[ ž一世= C| X一世,θ ]≥ Σ我= 15∑C∈ { A ,B }镨[ ž一世= C| X一世,θ ] ⋅ 日志镨[ X一世,Z一世= C| θ]镨[ ž一世= C| X一世,θ ]。
日志
现在什么是?给定实验X i和θ,这是我们看到硬币C的概率。使用条件概率,我们有Pr [ Z i = C | X i,θ ] = Pr [ X i,Z i = C | θ ]镨[ ž一世= C| X一世,θ ]CX一世θ
镨[ ž一世= C| X一世,θ ] = Pr [ X一世,Z一世= C| θ]镨[ X一世| θ]。
尽管我们已经取得了一些进展,但是我们还没有完成该模型。给定硬币翻转序列的概率是多少?令h i = #in X i Pr [ X i,Z iX一世H一世= #个X头 一世
现在,Pr[Xi| θ]显然只是Zi=A或Zi=B的两种可能性下的概率。由于Pr[Zi=A]=Pr[
镨[ X一世,Z一世= C|θ]=12⋅θhiC(1−θC)10−hi, 对于 C ∈ { A ,B } 。
镨[ X一世| θ]ž一世= Až一世= B,我们有,
镨[ ž一世= A ] = Pr [ Z一世= 乙] = 1 / 2镨[ X一世| θ]=1 / 2⋅(镨[ X一世| ž一世= A ,θ ] + Pr [ X一世| ž一世= B ,θ ] )。
电子步
好的,这并不是很有趣,但是我们现在可以开始进行一些EM工作。EM算法首先对进行一些随机猜测。在这个例子中,我们有θ 0 = (0.6 ,0.5 )。我们计算
Pr [ Z 1 = A | X 1,θ ] = 1 / 2 ⋅ (0.6 5 ⋅ 0.4 5)θθ0= (0.6 ,0.5 )
该值与本文中的内容一致。现在我们可以从硬币A,
E计算X1=(H,T,T,T,T,H,H,T,H,T,H)中的期望正面数
镨[ ž1个= A | X1个,θ ] = 1 / 2 ⋅ (0.65⋅ 0.45)1 / 2 ⋅ ((0.65⋅ 0.45)+ (0.55⋅ 0.55))≈0.45 。
X1个= (高,Ť,Ť,Ť,H,H,Ť,H,Ť,H)一种 ħ 1 ⋅ 镨[ Ž 1 = 乙
对得到的硬币
B做同样的事情,
E [ 硬币B的#个头 | X 1,θ ] = | X 1,θ ] = 5 ⋅ 0.55 ≈ 2.8。E [ #个硬币A 的正面 | X1个,θ ] = h1个⋅ 镨[ ž1个= A | X1个,θ ] = 5 ⋅ 0.45 ≈ 2.2。
乙E [ #个硬币B 头 | X1个,θ ] = h1个⋅ 镨[ ž1个= B | X1个,θ ] = 5 ⋅ 0.55 ≈ 2.8。
通过用
代替
10 - h 1,我们可以计算出相同的尾数。这个持续的所有其他值
X 我和
ħ 我 1 ≤ 我≤ 5。由于期望的线性,我们可以找出
E [ #个硬币A的头部 | X ,θ ] = 5 ∑ i = 1H1个10 - ^ h1个X一世H一世 1 ≤ 我≤ 5E [ #个硬币A 的正面 | X,θ ] = ∑我= 15E [ #个硬币A 的正面 | X一世,θ ]
M步
θ
θ1个一种= E[ #超过 X 通过硬币 A | X,θ ]Ë[ #超过X的头和尾 通过硬币 A | X,θ ]= 21.321.3 + 9.6≈ 0.71。
乙θ1个θθ^= θ10= (0.8 ,0.52 )镨[ X,Z| θ]θ
θ^