卡方拟合优度检验的基本结果可以分层理解。
0级。经典的Pearson卡方检验统计针对固定概率向量测试样品多项式是
X 2(p )= ķ Σ我=p
其中 X (n ) i表示大小为 n的样本中第 i个单元格中结果的数量。这可以看作是向量 Y n = (Y (n ) 1,… ,Y (n ) k)的平方范数,其中 Y (n ) i
X2(p)=∑i=1k(X(n)i−npi)2npi→dχ2k−1,
X(n)iinYn=(Y(n)1,…,Y(n)k),根据多元中心极限定理,该分布收敛为
Y n d → N(0,I- √Y(n)i=(X(n)i−npi)/npi−−−√
由此我们看到,
X 2 = ‖ ý Ñ ‖ 2 →交通χ 2 ķ - 1因为
我 - √Yn→dN(0,I−p–√p–√T).
X2=∥Yn∥2→χ2k−1是秩
k−1的幂等。
I−p–√p–√Tk−1
1级。在层次结构的下一个级别,我们考虑具有多项式样本的复合假设。由于在原假设下未知确切的关注,我们必须对其进行估计。如果零假设是复合的,并且由维度为m的线性子空间组成,则p i的最大似然估计(或其他有效估计)可以用作“插入”估计。然后,统计量
X 2 1 = k ∑ i = 1(X (npmpi
在原假设下。
X21=∑i=1k(X(n)i−np^i)2np^i→dχ2k−m−1,
2级。考虑一个参数模型的拟合测试的良好性的情况,在该模型中,单元是固定的且事先已知:例如,我们有一个采样率为的指数分布样本,然后通过对k个像元进行分箱来生成多项式样本,如果我们仅使用观察到的频率使用bin概率本身的有效估计(例如MLE),则上述结果仍然成立。λk
mm=1
X22=∑i=1k(X(n)i−np^i)2np^i→dχ2k−m−1,
p^i
Z1,…,Zn∼Fλλχ2k−m−1χ2k−1
YnN(0,I−pλ−−√pλ−−√T−A(λ))
λA(λ)
YnB(λ^)
YTnBTBYn→dχ2k−1,
k
例如Rao–Robson–Nikulin统计和Dzhaparidze–Nikulin统计。
k1/kI^j=μ^+σ^I0,jI0,j=[F−1((j−1)/k),F−1(j/k))
参考文献
A. W. van der Vaart(1998),《渐进统计》,剑桥大学出版社。第17章:卡方检验。
H. Chernoff和EL Lehmann(1954), χ2
FC Drost(1989),当类别数趋于无穷大时,针对位置尺度模型的广义卡方拟合优度检验,Ann。统计,第一卷。17号 3,1285-1300年。
MS尼库林,MS(1973),卡方检验用于连续分布带换档和尺度参数,概率论及其应用,第一卷。19号 3,559–568。
KO Dzaparidze和MS Nikulin(1973),关于对Pearson标准统计量的修改,《概率论及其应用》,第1卷。19号 4,851–853。
KC Rao和DS Robson(1974),指数族内拟合检验优度的卡方统计量,Comm。统计员。第三卷,没有。12,1139–1153年。
N. Balakrishnan,V.Voinov和MS Nikulin(2013年),《Chi-Squared拟合优度与应用》,学术出版社。