所述拟合优度测试使用以下统计: 在测试中,授予该该条件得到满足,一个用途 - 分布来计算p值,鉴于条件之一将相同尺寸的代表性样品中观察这样的值。χ 2 0 = Ñ Σ我= 1(直径:我 - ë 我)2 χ2ħ0
但是,为了使统计遵循(具有个自由度),必须为: 用于独立的标准普通(Wikipedia)。测试的条件如下(同样来自Wikipedia): χ 2 ñ - 1 ñ Σ我= 1(直径:我 - ë 我)2 Zi
- 人口样本代表
- 大样本量
- 预期细胞数足够大
- 每个类别之间的独立性
从条件(1,2)可以看出,我们满足了从样本到总体的推断条件。(3)似乎是一个必要的假设,因为分母中的离散计数不会导致每个的近连续分布,并且如果它不够大,则存在可以用Yates校正的误差校正 -这似乎是由于以下事实:离散分布基本上是“泛滥”的连续分布,因此每个分布的偏移都可以对此进行校正。ž 我
(4)的必要性似乎稍后会派上用场,但我不知道如何。
起初,我认为对于使统计信息与分布匹配是必要的。这使我得出一个令人质疑的假设,即,这确实是错误的。实际上,从等式两边的维数从到可以看出,事实并非如此。
由于whuber的解释,很明显不必等于每个项,因为对于功能独立的标准正态随机变量,(注意总的减少)。
那么,我的问题是如何遵循分布?项中的每一个的什么样的组合会导致平方标准法线?显然,这需要使用CLT(这很有意义),但是如何?换句话说,每个等于(或近似等于)是多少? Z 2 i Zi