在与威尔克斯定理的有限混合中找到高斯数?


11

假设我有一组独立的,均匀分布的单变量观测值以及关于x是如何产生的两个假设:xx

x是从均值和方差未知的单个高斯分布中得出的。H0x

x是由两个均值,方差和混合系数未知的高斯混合而成的。HAx

如果我理解正确,则这些是嵌套模型,因为如果将两个高斯的参数约束为相同或将两个高斯之一的混合系数约束为零,则可以用H A来描述表示的模型。。 H0HA

因此,看来您应该能够使用EM算法来估计的参数,然后使用Wilks定理来确定H A下数据的可能性是否明显大于H 0下。假设EM算法将在此处收敛到最大可能性,这是一个小小的信念飞跃,但这是我愿意做的。HAHAH0

我在蒙特卡洛模拟中对此进行了尝试,假设H 0(第二个高斯和混合参数的均值和方差)多3个自由度。当我从H 0模拟数据时,我得到的P值分布基本上是不均匀的,并且丰富了较小的P值。(如果EM不能收敛到真正的最大似然,则可以预期正好相反。)我对产生这种偏差的Wilks定理的应用有什么问题?HAH0H0

Answers:


8

μ1,μ2,σ1,σ2,ρ

H0:(μ1=μ2 and σ1=σ2) or ρ{0,1}.
ρρ

零假设是整个参数空间的复杂子集,在零条件下,参数甚至无法识别。打破威尔克定理所需的通常假设,最明显的是,不可能构建对数似然的适当泰勒展开。

对于这个特殊的问题,我没有任何亲身经验,但是我知道在其他情况下参数在null下“消失”的情况也是如此,在这些情况下,Wilk定理的结论也被分解了。 。通过快速搜索,除其他事项外,这篇论文看起来很相关,并且在哪里您可以找到与混合模型有关的似然比检验的更多参考。


谢谢。我认为可能是这样的问题,但是我不确定。对于威尔克斯定理而言,构成嵌套模型的细微之处令我有些困惑。空值下关于可识别性的好点。
dsimcha 2011年

4

ρ在参数空间的边界上,并且(b)在null下无法确定参数。这并不是说广义似然比的分布是未知的!如果您设置中的所有5个参数都是未知的,更重要的是无界的,那么LR统计量的分布就不会收敛。如果所有无法识别的参数都有界,则LR统计量在截断的高斯过程的极值中是单调的。在一般(5参数)情况下,即使在您拥有协方差的情况下,也不容易计算出它的协方差。有关两组分混合物的一些实际结果,请参见此处。有趣的是,该论文表明,在相当简单的设置中,LR统计实际上不如一些简单统计强大。有关在此类问题中得出渐近分布的开创性论文,请参见此处。出于所有实际目的,您可以使用EM拟合混合物,然后引导LR统计信息的分布。由于已知EM速度较慢,这可能需要一些时间,并且您需要进行大量复制才能捕获样本量的影响。有关详细信息,请参见此处

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.