让我们继续前进,杀死5%的神圣牛。
您(正确)指出问题在于测试的强大功能。您可能需要将其重新校准为更相关的功效,例如更传统的值为80%:
- 确定您要检测的效果大小(例如0.2%偏移)
- 确定对您足够好的电源,以使其不会过载(例如1−β=80%)
- 从现有的Pearson测试理论出发,确定可以使您的测试实用的水平。
假设您有5个具有相等概率的类别,,您的替代选择是。因此对于,。渐近分布是非中心卡方与(#类别-1)= 4 DF和非集中参数
利用该大值,足够接近。80%区块为p1=p2=p3=p4=p5=0.2p+δ/n−−√=(0.198,0.202,0.2,0.2,0.2)n=106δ=(−2,+2,0,0,0)k=
λ=∑jδ2j/pj=4/0.2+4/0.2=40
λN(μ=λ+k=44,σ2=2(k+2λ)=168)44+13⋅Φ−1(0.8)=44+13⋅0.84=54.91。因此你的测试的期望的水平是的逆尾CDF从54.91:
因此,这将是水平你应该考虑在以下位置测试您的数据,使其具有80%的功效来检测0.2%的差异。
χ24Prob[χ24>54.91]=3.3⋅10−11
(请检查我的数学,这是一个荒谬的测试水平,但这就是您想要的大数据,不是吗?另一方面,如果您通常看到Pearson在几个范围内百,这可能是一个完全有意义的关键价值。)χ2
请记住,尽管零值和替代值的近似值在尾部可能效果不佳,请参见本讨论。