Answers:
原则上,EM和标准优化方法均可用于拟合混合物分布。与EM一样,凸优化求解器将收敛到局部最优。但是,存在多种优化算法,可以在存在多个局部最优值的情况下寻求更好的解决方案。据我所知,收敛速度最快的算法将取决于问题。
EM的一个好处是,它自然会在每次迭代中为混合物的分布产生有效的参数。相反,标准优化算法将需要施加约束。例如,假设您要拟合高斯混合模型。一种标准的非线性规划方法将要求将协方差矩阵约束为正半定值,并且将混合分量权重约束为非负且总和为1。
为了在高维问题上获得良好的性能,非线性编程求解器通常需要利用梯度。因此,您必须导出梯度或使用自动微分来计算它。如果约束函数没有标准形式,则也需要渐变。牛顿的方法和相关方法(例如信任区域方法)也需要使用Hessian。如果无法获得梯度,则可以使用有限差分或无导数方法,但是随着参数数量的增加,性能往往无法很好地扩展。相反,EM不需要渐变。
EM在概念上很直观,这是一个很大的优点。这通常也适用于标准优化方法。有许多实现细节,但是总体概念很简单。通常可以使用标准的优化求解器将这些细节抽象化。在这些情况下,用户仅需提供目标函数,约束和梯度,并具有足够的工作知识即可选择非常适合该问题的求解器。但是,如果要达到用户必须考虑或实现优化算法的低级细节的程度,则肯定需要专业知识。
EM算法的另一个好处是可以在缺少某些数据值的情况下使用它。
同样感兴趣的(包括评论):