这可能是答案的性质,尽管准确,但可能没什么用。Horvitz和Thompson(1952)提供的结果通常涵盖了这种情况。这些结果是根据人们可能期望的组合表达式给出的。
为了与它们的符号保持一致,并与更广泛使用的符号更好地对应,让我重新定义一些数量。令为总体中元素的数量,为样本数量。Nn
令,表示总体中的元素,具有给定值,和选择概率。对于大小为的给定样本,令样本中的观察值为。uii=1,...,NNVii=1,...,Np1,...,pNnv1,...,vn
期望的是样本总数的均值和方差
∑i=1nvi.
如评论中所述,选择顺序绘制的特定样本的概率为
其中绘制的初始概率 由给出 ,绘制的第二概率以将从总体中删除为条件,依此类推。因此,随后绘制的每个单元都会为下一个单元产生新的概率分布(因此,选择不同的字母,因为每个字母代表不同的分布。)s={ui,uj,...,ut}
Pr(s)=pi1pj2⋯ptn,
pi1uipipj2ujui
有
个大小为样本,在整个总体中包含。请注意,这考虑了样本的排列。
S(i)=n!(N−1n−1)
nuin!
令表示大小为的特定样本,其中包括。然后,选择元素的概率由
其中求和超过的大小的集合大小为所有可能样本都包含。(我对论文的表示法做了些改动,因为它使我感到困惑。)s(i)nnuiui
P(ui)=∑Pr(s(i)n),
S(i)s(i)nnui
同样地,定义
作为同时包含和的样本数。然后,我们可以定义同时包含的样本的概率
其中总和超过大小集的所有可能的样品的大小的包含和。
S(ij)=n!(N−2n−2)
uiujP(uiuj)=∑Pr(s(ij)n),
S(ij)s(ij)nnuiuj
然后将期望值导出为
E(∑i=1nvi)=∑i=1NP(ui)Vi.
尽管在本文中未明确得出方差,但可以从第个矩
期望中获得方差
和叉积
q
E(∑i=1nvqi)=∑i=1NP(ui)Vqi
E(∑i≠jnvivj)=∑i≠jP(uiuj)ViVj.
换句话说,似乎需要遍历所有可能的子集来进行这些计算。不过,也许可以对较小的值执行此操作。n
Horvitz,DG和Thompson,DJ(1952)采样的概括,没有从有限的宇宙中替换。美国统计协会杂志 47(260):663-685。