推导最大似然估计
假设我们有随机向量,每个尺寸的p:X (1 ),X (2 ),。。。,X (米),其中每个随机向量可以跨越被解释为观测(数据点)p的变量。如果每个X (i )作为多元高斯向量被iid表示:米pX(1 ),X(2 ),。。。,X(米)pX(我)
X(我)〜ñp(μ ,Σ )
参数未知。为了获得他们的估计,我们可以使用最大似然方法并使对数似然函数最大化。μ ,Σ
注意,由随机向量的独立性,数据的联合密度是各个密度的乘积,即∏ m i = 1 f X (i )(x (i ) ; μ ,Σ)。取对数给出对数似然函数{ X(我),我= 1 ,2 ,。。。,m }∏米我= 1FX(我)(x(我);μ,Σ)
l(μ,Σ|x(i))=log∏i=1mfX(i)(x(i)|μ,Σ)=log ∏i=1m1(2π)p/2|Σ|1/2exp(−12(x(i)−μ)TΣ−1(x(i)−μ))=∑i=1m(−p2log(2π)−12log|Σ|−12(x(i)−μ)TΣ−1(x(i)−μ))
l(μ,Σ;)=−mp2log(2π)−m2log|Σ|−12∑i=1m(x(i)−μ)TΣ−1(x(i)−μ)
派生μμ^
为了获得关于的导数并等于零,我们将使用以下矩阵演算恒等式:μ
如果瓦特
不依赖于阿和阿是对称的。∂wTAw∂w=2AwwAA
∂∂μl(μ,Σ|x(i))0μ^=∑i=1mΣ−1(μ−x(i))=0Since Σ is positive definite=mμ−∑i=1mx(i)=1m∑i=1mx(i)=x¯
通常称为样本均值向量。
推导ΣΣ^
推导协方差矩阵的MLE需要更多的工作,并需要使用以下线性代数和微积分属性:
- 在矩阵乘积的循环排列下,迹线是不变的:tr[ACB]=tr[CAB]=tr[BCA]
- 由于是标量,因此我们可以追踪它并获得相同的值:x t A x = t r [ x T A x ] = t r [ x t x A ]xTAxxtAx=tr[xTAx]=tr[xtxA]
- ∂∂Atr[AB]=BT
- ∂∂Alog|A|=A−T
结合这些属性,我们可以计算
∂∂AxtAx=∂∂Atr[xTxA]=[xxt]T=xTTxT=xxT
向量与自身的外积。x
现在,我们可以重新写数似然函数和计算导WRT (注ç为常数)Σ−1C
l (μ ,Σ | x(我))∂∂Σ− 1l (μ ,Σ | x(我))= C − 米2日志| Σ | − 12∑我= 1米(x(我)- μ )ŤΣ− 1(x(我)- μ )= C + 米2日志| Σ− 1| − 12∑我= 1米吨- [R [ (X(我)- μ )(X(我)- μ )ŤΣ− 1]= 米2Σ - 12∑我= 1米(x(我)- μ )(X(我)- μ )Ť 由于 ΣŤ= Σ
等于零并求解Σ
0Σ^= m ∑ - ∑我= 1米(x(我)- μ )(X(我)- μ )Ť= 1米∑我= 1米(x(我)- μ^)(x(我)- μ^)Ť
资料来源