为什么似然比检验分布卡方?


34

为什么似然比检验的检验统计量分布卡方?

2ln 大号一种Ť ØdË-ln 大号ñü ØdËχdF一种Ť-dFñü2



14
感谢您的参考。这是我的一封信
Beeblebrox博士

5
注意那里的“带来幽默感”。我本来不打算粗鲁的,但是这个问题的答案将相对繁琐,并且基本上由该文章(或一些更好的统计学教科书)的内容组成。如果您在其中之一中说明您的确切问题,我将很乐意为您提供帮助。
Nick Sabbe 2013年

2
直接链接到威尔克斯的原始论文,没有付费专区。
ayorgo

Answers:


23

正如@Nick提到这是一个后果Wilks的定理。但请注意,测试统计量是渐近 ,而不是。χ 2χ2χ2

这个定理给我留下了深刻的印象,因为它在很宽的范围内适用。考虑一个似然度为的统计模型,其中是参数的分布中独立复制观测值的向量观测 值,该分布属于子流形,维度为。令是尺寸为的子流形。假设您对测试有兴趣。ý ñ θ 1 - [R ð暗淡1= 小号01个暗淡0= ħ 0{ θ ∈ 0 }θÿÿñθ1个[Rd暗淡1个=sB0B1dim(B0)=mH0:{θB0}

似然比是 定义偏差。然后,威尔克斯定理说,在通常的正则性假设下,当成立时,渐近以自由度分布。dÝ=2日志- [R ÝdÝχ2个小号-ħ0

lr(y)=supθB1l(θy)supθB0l(θy)
dÿ=2日志[Rÿdÿχ2s-H0

事实证明在威尔克最初的论文由@Nick提及。我认为这篇文章不容易阅读。威尔克斯后来出版了一本书,也许最简单地介绍了他的定理。威廉姆斯的优秀著作中给出了简短的启发式证明。



5
哦,来吧,斯蒂芬。这是维基百科,您可以对其进行编辑和改进!
StasK 2013年

1
@StasK我知道,但我从未尝试过。我已经在统计和数学上度过了我的一生;)
StéphaneLaurent 2013年

是否存在直觉,为什么偏差定义中2位于日志的前面?
user56834 '18年

@ Programmer2134它是从二阶taylor扩展派生的。
Frank Vel '18

25

我第二次对尼克·萨贝(Nick Sabbe)的严厉评论,我的简短回答是,不是。我的意思是,仅在正常线性模型中。对于绝对任何其他情况,确切的分布都不是。在许多情况下,您可以希望满足Wilks定理条件,然后渐近对数似然比检验统计量收敛到分布。威尔克斯定理条件的局限性和违反性太多,不容忽视。χ 2χ2χ2

  1. 该定理假设iid数据期望相关数据的问题,例如时间序列或不等概率调查样本(无论如何,其可能性定义不充分;“常规”检验,例如列联表中的独立性检验,开始表现为总和(Rao&Scott)。对于iid数据,,总和变为。 -独立数据,现在不再如此。χ 2 Σ ķ 一个ķ v ķv ķIID χ 2 1一个ķ = 1 χ 2χ2ķ一种ķvķvķ艾德χ1个2一种ķ=1个χ2
  2. 该定理假设真实参数在参数空间内部。如果您有一个欧几里得空间可以使用,那不是问题。但是,在某些问题中,可能会出现自然限制,例如方差 0或-1与1之间的相关性。如果真实参数是边界,则渐近分布是不同程度的混合从测试的cdf等于此类cdf的总和的意义上讲(安德鲁斯2001,加上他在同一时期的另外两三篇论文,历史可以追溯到切尔诺夫1954)。χ 2χ2
  3. 该定理假设所有相关导数都不为零。可能会遇到一些非线性问题和/或参数化,和/或在null下未标识参数的情况,这可能会受到挑战。假设您有一个高斯混合模型,并且您的null为一个分量与两个不同分量和混合分数。空值显然是在替代方案中嵌套的,但是可以用多种方式表示:当(在这种情况下未识别参数),(在这种情况下,˚F Ñ μ 1σ 2 1+ 1 - ˚F ñ μ 2σ 2 2˚F ˚F = 0 μ 1σ 2 1 ˚F = 1 μ 2σ 2 2 μ 1 = μ 2σ 1ñμ0σ02Fñμ1个σ1个2+1个-Fñμ2σ22FF=0μ1个σ1个2F=1个μ2,σ22(未标识)或(在这种情况下,未标识)。在这里,您甚至无法说出测试应该具有多少自由度,因为取决于嵌套参数化的方式,限制的数量不同。参见Chenjiahua Chen的著作,例如CJS 2001 ˚Fμ1=μ2,σ1=σ2f
  4. 该可能工作确定,如果发行被正确指定。但是,如果不是,则测试将再次失败。在称为结构方程协方差建模的多元分析的子区域中(通常被统计学家所忽略),通常假设多元正态分布,但是即使结构正确,如果分布不同,则测试也会表现异常。Satorra和Bentler 1995显示,分布将变成,与我的观点1中使用非独立数据的情况相同,但是他们还证明了 s取决于模型的结构和分布的第四阶矩。Σ ķ 一个ķ v ķv ķIID χ 2 1一个ķχ2kakvk,vki.i.d.χ12ak
  5. 对于有限样本,在大类情况下,似然比是Bartlett可校正的:而对于大小为的样本,并且是分布的分布函数,对于正则似然问题,您可以找到一个常数,使得,即准确性。因此,可以改善有限样本的逼近度(如果知道如何可以说应该提高)。常数ñ ˚F X ; χ 2 dχ 2 d b P - [R ö b [ d y /1 + b / n Prob[d(y)x]=F(x;χd2)[1+O(n1)]nF(x;χd2)χd2bχ 2 bProb[d(y)/(1+b/n)x]=F(x;χd2)[1+O(n2)]χ2b 取决于模型的结构,有时还取决于辅助参数,但是如果可以始终如一地进行估算,那么这对改善覆盖范围也很有用。

有关这些和类似的神秘问题的可能性推断的综述,请参见Smith 1989


1
谢谢!很有启发性。“仅在正常线性模型中”是什么意思?对于Fisher检验,当和是线性子空间时,偏差是Fisher统计量的单调函数,并且仅渐近1 χ 2B0B1 χ2
斯蒂芬·洛朗

在已知方差的情况下,我应该补充。
StasK 2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.