两个样本卡方检验


10

这个问题来自范德法特(Van der Vaart)的书《渐近统计》(渐近统计)。253.#3:

假设和是具有参数和独立多项式向量。在零假设下表明XmYn(m,a1,,ak)(n,b1,,bk)ai=bi

i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i
具有分布。其中。Ç = X + ÿ Ñ /+ Ñ χk12c^i=(Xm,i+Yn,i)/(m+n)

我需要一些入门帮助。这里的策略是什么?我能够将两个求和数合并为:

i=1k(mYn,inXm,i)2mn(m+n)c^i

但与CLT,因为它的加权组合这不会工作XmYn。不确定这是否是正确的路径。有什么建议么?

编辑:如果m=n则很容易,因为我们得到

mYnnXmmn(m+n)=YnXm(m+n)

其中分子可以看作是多项式变量的差之和,因此我们可以应用CLT,然后使用同一章的定理17.2结束它。但是,我无法弄清楚如何在这种情况下使用不同的样本量来解决这个问题。有什么帮助吗?(1,a1,,ak)

链接到van der Vaart的 Google图书的第17章

Answers:


6

首先是一些符号。令和表示与相关的分类序列和,即。令。考虑二元化 其中是克罗内克的三角洲。所以我们有{ Y t } 1 n X m Y nPr { X t =i } =aiPr { Y t =i } =biN=n+m X * 一世{Xt}1,,m{Yt}1,,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+mδĴ1=ĴXi=Nt=1X*t

Xi=(X1,i,,XN,i)=(δi,X1,,δi,Xn,0,,0)Yi=(Y1,i,,YN,i)=(0,,0,δi,Y1,,δi,Yn)
δi,j1i=j
Xm,i=t=1NXt,i=t=1mδi,XtYn,i=t=1NYt,i=t=1nδi,Yt

现在我们开始证明。首先,我们将检验统计量的两个合计相结合。请注意, 因此我们可以将测试统计信息写为小号

Xm,imc^i=(n+m)Xm,im(Xm,i+Yn,i)n+m=nXm,imYn,in+mYn,inc^i=(n+m)Yn,in(Xm,i+Yn,i)n+m=mYn,inXm,in+m
S=i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i=i=1k(nXm,imYn,i)2(n+m)2mc^i+i=1k(nXm,imYn,i)2(n+m)2nc^i=i=1k(nXm,imYn,i)2nm(n+m)c^i

接下来注意, 与以下属性

nXm,imYn,i=t=1NnXt,imYt,i=Zi
E[Zi]=nE[Xm,i]mE[Yn,i]=nmainmai=0Var[Zi]=Var[nXm,imYn,i]=n2Var[Xm,i]m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1ai)+m2nai(1ai)=nm(n+m)ai(1ai)Cov[Zi,Zj]=E[ZiZj]E[Zi]E[Zj]=E[(nXm,imYn,i)(nXm,jmYn,j)]=n2(maiaj+m2aiaj)2n2m2aiaj+m2(naiaj+n2aiaj)=nm(n+m)aiaj

因此,通过多元CLT,我们有,其中的的第i个元素,。由于通过Slutsky,我们有其中是单位矩阵,ĴΣσĴ=一个δĴ-

1nm(n+m)Z=nXmmYnnm(n+m)DN(0,Σ)
(i,j)Σσij=ai(δijaj)c^=(c^1,,c^k)p(a1,,ak)=a
nXmmYnnm(n+m)c^DN(0,Ikaa)
Ikk×ka=(a1,,ak)。由于具有乘数1的特征值0和乘数特征值1(通过连续映射定理(或参见范德瓦尔特的引理17.1,定理17.2)有ķ-1 ķ Σ=1Ñ X - ÿ Ñ 2Ikaak1
i=1k(nXm,imYn,i)2nm(n+m)c^iDχk12
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.