近年来,bootstrap方法得到了极大的推广,我也经常使用它,特别是因为背后的原因很直观。
但这是我不明白的一件事。为什么埃夫隆选择通过替换进行重采样,而不是通过随机包含或排除单个观测值来简单地进行二次采样?
我认为随机二次抽样具有非常好的质量,理想地代表了现实生活中的情况,在这种情况下,我们在研究中得到的观察值是假设总体的子集。我没有看到在重采样期间增加观察数的优势。在实际情况下,没有观察到与其他观察相似的情况,尤其是对于复杂的多元情况。
3
用重新采样进行重新采样是因为在给定模型的情况下这是正确的事情。引导程序背后的模型是使用非参数最大似然来估计累积分布函数,然后从估计的累积分布函数中采样独立的观测值。考虑一下-从算法上讲,这是通过从原始样本中进行替换采样而获得的。
—
kjetil b halvorsen