最近研究了引导程序后,我想到了一个概念性问题,但仍然使我感到困惑:
您有一个人口,并且想知道一个人口属性,即,在这里我用代表人口。例如,这个可能是人口平均值。通常,您无法从总体中获取所有数据。因此,您从总体中得出了大小为的样本为了简单起见,假设您有iid示例。然后,您获得估算器。您想使用来推断,因此您想知道的可变性 。P θ X Ñ θ = 克(X )θ θ θ
首先,存在的真实采样分布。从概念上讲,您可以从总体中抽取许多样本(每个样本的大小均为)。每次您都有因为每次您都有不同的样本。然后最后,您将能够恢复的真实分布。好的,至少这是估算分布的概念基准。让我重申一下:最终目标是使用各种方法来估计或近似的真实分布。 Ñ θ =克(X) θ
现在,问题来了。通常,只有一个样本包含数据点。然后,您可以多次从该样本中重新采样,然后得出的引导分布。我的问题是:此引导分布与的真实采样分布有多接近?有没有量化的方法?Ñ θ




其中LHS真实CDF比较与经验CDF为的观测和RHS曲线的LHS的复制品,对250个不同的样品,以测量cdf近似值的变异性。在示例中,我了解了事实,因此可以根据事实进行模拟,以评估变异性。在现实情况下,我不知道,因此必须从才能生成类似的图形。