有限校正因子的说明


25

我了解,当从有限总体中进行抽样并且我们的样本量大于总体的5%时,我们需要使用以下公式对样本的均值和标准误进行校正:

FPC=NnN1

其中是总体数量,是样本数量。ñNn

我对此公式有3个问题:

  1. 为什么将阈值设置为5%?
  2. 公式是如何得出的?
  3. 是否有全面的解释,除了这个公式其他在线资源,这个文件?

8
您不纠正均值!
whuber

2
您只需更正方差。
SmallChess '16

Answers:


25

选择阈值是为了确保将超几何分布(是其SD)收敛到正态分布(而不是二项分布(用于替换抽样))(这是中心极限定理,例如参见正态曲线,中心极限定理和随机变量的马尔可夫和切比雪夫不等式。换句话说,当(即与相比不是太大)时,可以安全地忽略FPC。很容易看出,对于固定的,校正因子如何随着变化而变化:在,NnN1Ñ Ñ Ñ Ñ Ñ = 10 000 FPC = 0.9995n/N0.05nNnNN=10,000FPC=.9995,当而,当。当,FPC接近1,我们接近替换抽样的情况(例如,无限人口)。FPC = 0.3162 Ñ = 9 000 Ñ →交通n=10FPC=.3162n=9,000N

要了解此结果,一个好的起点是阅读一些有关采样理论的在线教程,其中无需替换即可进行采样(简单随机采样)。这份有关非参数统计的在线教程提供了有关计算总期望值和方差的插图。

您会注意到,有些作者在FPC的分母中使用而不是。实际上,这取决于您是使用样本统计还是总体统计:对于方差,如果您对而不是感兴趣,它将是而不是。Ñ - 1 ñ ñ - 1 s ^ 2 σ 2NN1NN1S2σ2

至于网上参考,我可以建议你


此公式用于有限的人口,但可以替换还是不替换?
skan 2015年

3
@skan,无需替换。
Black Milk'3
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.