这个问题是很久以前提出的,但我发布了答复,以防将来有人发现。简而言之,答案是肯定的:您可以在许多设置中执行此操作,并且有理由通过来纠正样本大小的变化。这种方法通常被称为出自举,而且在绝大多数情况设置工作的``传统“””引导做,以及一些设置在它没有。中号ñ--√中号ñ
原因是许多引导程序一致性参数使用形式的估计量,其中是随机变量,而是基础分布。例如,对于样本均值,和。1个ñ√(Tñ- μ )X1个,… ,XñμŤñ= 1ñ∑ñ我= 1X一世μ = E(X1个)
许多引导程序一致性证明认为,给定有限样本和关联点估计,,
,其中是从真实基础分布中提取的,而是从替换而来的。ñ→ ∞{ x1个,… ,xñ}μ Ñ = Ť Ñ(X 1,... ,X Ñ)√μ^ñ= Tñ(x1个,… ,xñ)ñ--√(Tñ(X∗1个,… ,X∗ñ)- μ^ñ)→dñ--√(Tñ(X1个,… ,Xñ)- μ )(1)
X一世X∗一世{ x1个,… ,xñ}
但是,我们也可以使用长度较短样本,并考虑估计量
事实证明,当,估计器()具有与上述大多数设置相同的限制分布,其中()持有,有些则没有。在这种情况下,()和()具有相同的极限分布,从而激发了校正因子,例如样本标准偏差。中号< N中号--√(T中号(X∗1个,… ,X∗中号)- μ^ñ)。(2)
中号,N→ ∞112√21个1个2中号ñ--√
这些参数都是渐近的,并且仅在极限。为此,请不要选择太小的,这一点很重要。有一些理论(例如下面的Bickel&Sakov)是关于如何根据选择最佳 以获得最佳理论结果的,但是在您的情况下,计算资源可能是决定因素。中号,N→ ∞中号 中号Ñ中号ñ
对于某些直觉:在许多情况下,我们将称为,因此
可以认为有点像的引导程序中的个,其中和(我使用小写字母来避免符号混淆)。通过这种方式,使用的的个引导程序来模拟()的分布比传统的(中的个问题)更``正确''μ^ñ→dμñ→ ∞ñ--√(Tñ(X1个,… ,Xñ)- μ ),(3)
米ñm = Nn = ∞中号Ñ中号<ÑÑÑ3中号ñ中号< NNN)种类。在您的情况下,一个额外的好处是,它的计算成本更低。
如您所述,Politis和Romano是主要论文。我发现Bickel等人(1997年)也很好地概述了自举中的MN
资料来源:
PJ Bickel,F Goetze,WR van Zwet。1997年。对少于观察结果进行重采样:收益,损失和损失补救措施。统计公报。n
PJ Bickel,萨科夫。2008年就选择的的OUF引导和置信区间的极值。统计公报。mmn