基于数据的bin边界对卡方拟合优度的影响?


18

撇开这种情况下卡方功率低的明显问题,想象通过对数据进行装箱,对未指定参数的某些密度进行卡方检验。

具体来说,假设平均值未知的指数分布和样本量为100。

为了获得每个bin合理数量的预期观察值,需要考虑一些数据(例如,如果我们选择将6个bin置于均值以下,将4个bin置于均值之下,则仍将使用基于数据的bin边界) 。

但是,这种基于查看数据的垃圾箱的使用可能会影响零值下测试统计量的分布。

我已经看到了很多关于以下事实的讨论:- 如果通过合并数据以最大似然来估计参数-每个估计参数会损失1 df(这个问题可以追溯到Fisher与Karl Pearson的问题)-但是我不记得了阅读有关根据数据本身查找bin边界的任何信息。(如果估计它们从未像素合并数据,然后用k仓检验统计量介于之间的分布χk2χkp2)。

这种基于数据的垃圾箱选择是否会严重影响重要程度或效力?有一些方法比其他方法更重要吗?如果有很大的影响,在大样本中会消失吗?

如果确实有实质性影响,那么在许多情况下,未知参数几乎毫无用处(尽管在很多文本中仍然提倡使用),这似乎将使用卡方检验,除非您有很好的经验。 -参数的先验估计。

讨论问题或引用参考(最好提及其结论)将很有用。


编辑,除了主要问题:

在我看来,对于指数*的特定情况(并可以考虑使用)有可能的解决方案,但是我仍然对影响选择箱边界的更普遍的问题感兴趣。

*例如,对于指数,可以使用最小的观测值(例如等于m)来粗略地了解将垃圾箱放置在哪里(因为最小的观测值的平均值为μ/n)。测试剩余的n1差异(xim)的指数性。当然,这可能会得出非常差的μ估计值μ,因此选择了不正确的箱,尽管我想人们可能会递归地使用该参数,以便从最低的两个或三个观测值中选择合理的箱,然后测试其余观测值的差异,以求取最小的最小顺序统计量中的最大值指数)


1
有趣的问题。我不知道答案,但是应该失去一定程度的自由的想法是有道理的。如果您还没有看到它,那么@whuber的答案应该是发人深省的:如何了解自由度。在我看来,至少在某些特定情况下,一些模拟研究应该可以使您有所建树。
gung-恢复莫妮卡

1
不确定这有多大帮助,但是在稳健估计领域中也存在类似的问题。具体而言,鲁棒估计(例如,修整后的均值)的方法通常需要参数化的输入(例如,定义要修整多少的参数)。可以通过数据驱动的方法来选择此参数(例如,在选择修整参数之前先查看尾巴的粗细)。但是,与固定参数规则相比,预选择修整参数确实会影响修整平均值的分布。在文学中处理它的通常方法是通过引导程序。
科林·T·鲍尔斯

@ColinTBowers-可能会有所帮助,谢谢。没有考虑过引导的可能性。
Glen_b-恢复莫妮卡

1
将问题分解为最简单的情况可能会很有趣。想象一下,您喜欢的分布中只有5个观测值,然后在数据中放置一个除法器就仅形成两个bin。
zkurtz

Answers:


15

卡方拟合优度检验的基本结果可以分层理解

0级。经典的Pearson卡方检验统计针对固定概率向量测试样品多项式X 2p = ķ Σ=p 其中 X n i表示大小为 n的样本中第 i个单元格中结果的数量。这可以看作是向量 Y n = Y n 1Y n k的平方范数,其中 Y n i

X2(p)=i=1k(Xi(n)npi)2npidχk12,
Xi(n)inYn=(Y1(n),,Yk(n)),根据多元中心极限定理,该分布收敛为 Y n d N0I-Yi(n)=(Xi(n)npi)/npi 由此我们看到, X 2 = ý Ñ 2 →交通χ 2 ķ - 1因为 -
YndN(0,IppT).
X2=Yn2χk12是秩k1的幂等。IppTk1

1级。在层次结构的下一个级别,我们考虑具有多项式样本的复合假设。由于在原假设下未知确切的关注,我们必须对其进行估计。如果零假设是复合的,并且由维度为m的线性子空间组成,则p i的最大似然估计(或其他有效估计)可以用作“插入”估计。然后,统计量 X 2 1 = k i = 1X npmpi 在原假设下。

X12=i=1k(Xi(n)np^i)2np^idχkm12,

2级。考虑一个参数模型的拟合测试的良好性的情况,在该模型中,单元是固定的且事先已知:例如,我们有一个采样率为的指数分布样本,然后通过对k个像元进行分箱来生成多项式样本,如果我们仅使用观察到的频率使用bin概率本身的有效估计(例如MLE)则上述结果仍然成立。λk

mm=1

X22=i=1k(Xi(n)np^i)2np^idχkm12,
p^i

Z1,,ZnFλλχkm12χk12

YnN(0,IpλpλTA(λ))

λA(λ)

YnB(λ^)

YnTBTBYndχk12,
k

例如Rao–Robson–Nikulin统计Dzhaparidze–Nikulin统计

k1/kI^j=μ^+σ^I0,jI0,j=[F1((j1)/k),F1(j/k))

参考文献

  1. A. W. van der Vaart(1998),《渐进统计》,剑桥大学出版社。第17章卡方检验

  2. H. Chernoff和EL Lehmann(1954), χ2

  3. FC Drost(1989),当类别数趋于无穷大时针对位置尺度模型的广义卡方拟合优度检验Ann。统计,第一卷。17号 3,1285-1300年。

  4. MS尼库林,MS(1973),卡方检验用于连续分布带换档和尺度参数概率论及其应用,第一卷。19号 3,559–568。

  5. KO Dzaparidze和MS Nikulin(1973),关于对Pearson标准统计量的修改《概率论及其应用》,第1卷。19号 4,851–853。

  6. KC Rao和DS Robson(1974),指数族内拟合检验优度的卡方统计量Comm。统计员。第三卷,没有。12,1139–1153年。

  7. N. Balakrishnan,V.Voinov和MS Nikulin(2013年),《Chi-Squared拟合优度与应用》,学术出版社。


5

我在下面至少找到了我问题的部分答案。(我仍想给某人该奖金,因此感谢您提供任何进一步的信息。)

Moore(1971)指出Roy(1956)和Watson(1957,58,59)表明,当卡方统计量的细胞边界是最佳渐近正态估计参数值的函数时,则在某些条件下,渐近零分布卡方统计量的仍然是 χķ-p-1个2 和一个加权和 p χ1个2 变量(用于 ķ 细胞, p 参数),其中权重介于0和1之间(使分布的cdf介于 χķ-p2 和一个 χķ2,正如我在问题中提到的使用ML估计时的分布),以及最后权重 p 条款不受该估计的影响。

参考文献

Moore DS(1971),《具有随机单元边界的卡方统计》安。数学。统计,第42卷第1期,147-156页。

罗伊·艾尔(Roy AR,1956),χ2斯坦福大学统计系,可变区间统计技术报告第1号

沃森,GS(1957),χ2拟合优度测试拟合为正态分布Biometrika44,336-348。

沃森,GS(1958年),χ2连续分布的拟合优度检验J。Royal Statist。Soc。乙20,44-61。

Watson,GS(1959),最近的一些结果χ2 goodness-of- fit tests, Biometrics, 15, 440-468

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.