我对获得数量X的自举置信区间很感兴趣,因为该数量在10个人中各有10次测量。
一种方法是获取每个人的均值,然后重新引导均值(例如,用替换对均值进行重新采样)。
另一种方法是在自举过程的每次迭代中执行以下操作:在每个个体内,用替换对那个个体的10个观察值重新采样,然后为那个个体计算一个新的均值,最后计算一个新的组均值。在这种方法中,原始数据集中观察到的每个个体在引导程序的每次迭代中总是对组均值有所贡献。
最后,第三种方法是将上述两种方法结合起来:对个体进行重新采样,然后在这些个体内进行重新采样。此方法与先前的方法不同之处在于,它允许同一个人在每次迭代中对组均值贡献乘数,尽管由于每个贡献都是通过独立的重采样过程生成的,所以这些贡献可能会彼此略有不同。
在实践中,我发现这些方法对置信区间的估计不同(例如,使用一个数据集,我发现第三种方法的置信区间要比前两种方法大得多),所以我很好奇每种方法可能是什么解释代表。