这可能是针对那些了解一些统计和数学(至少是微积分)的人们的更具技术性的解释。这是我前一段时间教授的有关调查引导程序的幻灯片:
当然,需要一些解释。是从现有数据中获取统计信息的过程(或更准确地说,是从分布函数到实数的函数;例如,平均值为,其中,对于样本分布函数,被理解为样本点处的点质量。在总体中,用表示,应用给出感兴趣的参数。现在,我们获取了一个样本(顶部的第一个箭头),并具有经验分布函数-我们对其应用以获得估计TE[X]=∫xdFFn()dFF()TθFn()Tθ^n。我们想知道距有多远?随机量在附近可能有什么分布?这是该图左下方的问号,这是引导程序试图回答的问题。重申龚先生的观点,这不是关于人口的问题,而是关于特定统计数据及其分布的问题。θθ^nθ
如果我们可以重复采样程序,则可以得到该分布并了解更多信息。好吧,这通常超出了我们的能力范围。但是,如果
- Fn在适当的意义上足够接近,并且F
- 映射是足够光滑,即,如果我们从小的偏差,将结果映射到接近号码,TF()θ
我们可以希望引导程序将起作用。也就是说,我们假装我们的分布是而不是,并且我们可以招待所有可能的样本-并且将有这样的样本,这仅对于是可行的。让我再重复一遍:引导程序可围绕“ true”参数创建的采样分布,并且我们希望在上述两个条件下,该采样分布能为采样分布提供更多信息周围的:Fn()F()nnn≤5θ^∗nθ^nθ^nθ
θ^∗n to θ^n is like θ^n to θ
现在,我们不仅可以沿着箭头方向前进,而且可以沿着这些箭头方向丢失一些信息/准确性,我们可以回过头说说周围。θ^∗nθ^n
上述条件在Hall(1991)的书中最详尽地阐述了。我所说的对微积分的理解是凝视这张幻灯片的先决条件,这是有关光滑度的第二个假设:在更正式的语言中,功能性必须具有弱导数。当然,第一个条件是一个渐近陈述:样本越大,应该越接近;从到应该与从到距离数量级相同。这些条件可能会破坏,并且确实会破坏TFnFθ^∗nθ^nθ^nθ在许多实际情况下,具有足够奇怪的统计数据和/或抽样方案,而这些方案和抽样方案没有产生足够接近经验分布。F
现在,这1000个样本或任何神奇的数字是从哪里来的?这是由于我们无法绘制所有样本,因此我们只抽取了其中的一个随机子集。最右边的“模拟”箭头表示我们正在获取周围分布的另一种近似方法,也就是说,我们的蒙特卡洛模拟了是在周围的完整引导分布的足够好的近似值。θ Ñ θ θ (* - [R ) ñ θ * Ñ θ Ñnnθ^nθθ^(∗r)nθ^∗nθ^n