为什么直接在计算上优化高斯混合很难?
考虑混合高斯的对数似然: l(Sn;θ)=∑t=1nlogf(x(t)|θ)=∑t=1nlog{∑i=1kpif(x(t)|μ(i),σ2i)}l(Sn;θ)=∑t=1nlogf(x(t)|θ)=∑t=1nlog{∑i=1kpif(x(t)|μ(i),σi2)}l(S_n; \theta) = \sum^n_{t=1}\log f(x^{(t)}|\theta) = \sum^n_{t=1}\log\left\{\sum^k_{i=1}p_i f(x^{(t)}|\mu^{(i)}, \sigma^2_i)\right\} 我想知道为什么要直接最大化该方程在计算上很困难?我一直在寻找一个清晰的直觉,以了解为什么它应该如此艰难,或者为什么要对其为何如此艰难做出更严格的解释。这个问题是NP完整的,还是我们还不知道如何解决?这是我们诉诸使用EM(期望最大化)算法的原因吗? 符号: SnSnS_n =训练数据。 x(t)x(t)x^{(t)} =数据点。 θθ\theta =一组参数,指定高斯,其均值,标准偏差以及从每个聚类/类/高斯生成点的概率。 pipip_i =从聚类/类/高斯i生成点的概率。