Questions tagged «finite-population»

1
有限校正因子的说明
我了解,当从有限总体中进行抽样并且我们的样本量大于总体的5%时,我们需要使用以下公式对样本的均值和标准误进行校正: FPC= N− nñ− 1----√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} 其中是总体数量,是样本数量。ññNNñnn 我对此公式有3个问题: 为什么将阈值设置为5%? 公式是如何得出的? 是否有全面的解释,除了这个公式其他在线资源,这个文件?

3
引导程序:过度拟合的问题
假设一个人通过从原始n个观测值中替换得到每个大小为n的样本来执行所谓的非参数引导。我相信此过程等效于通过经验CDF估算累积分布函数:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function 然后通过从估计的cdf B次连续模拟观察值来获得引导程序样本。nnnBBB 如果我对此是正确的,则必须解决过度拟合的问题,因为经验CDF具有大约N个参数。当然,它渐近收敛于总体cdf,但是有限样本呢?例如,如果我告诉你,我有100个观测,我会估计CDF为N(μ,σ2)N(μ,σ2)N(\mu, \sigma^2)有两个参数,你就不会惊慌。但是,如果参数数量增加到100,则似乎根本不合理。 同样地,当一个采用标准多元线性回归,误差项的分布被估计为。如果有人决定改用残差自举法,他必须意识到现在大约有nN(0,σ2)N(0,σ2)N(0, \sigma^2)nnn参数仅用于处理误差项分布。 您能否将我定向到一些明确解决此问题的消息源,或者告诉我如果您认为我做错了为什么这不是问题。

4
为什么在实际应用中根本不考虑采样而不更换采样?
如我所见,带替换的采样比不带替换的采样有两个优点: 1)您不必担心有限的人口校正。 2)有机会多次绘制总体中的元素-然后您可以循环使用测量并节省时间。 当然,从学术观点出发,必须研究这两种方法。但是从实际的POV来看,鉴于替换的优势,我不明白为什么不考虑不替换就进行采样。 但是我是统计学的初学者,因此可能有很多充分的理由说明为什么不进行替换可能是更好的选择-至少对于特定用例而言。拜托,让我困惑!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.