套袋为何使用自举样品?


10

套袋是在N个不同的引导样本上创建N个学习者,然后取其预测平均值的过程。

我的问题是:为什么不使用任何其他类型的采样?为什么要使用引导程序样本?

Answers:


9

有趣的问题。与折刀之类的一些替代方法相比,该引导程序具有良好的采样属性。自举的主要缺点是,每次迭代都必须使用与原始数据集一样大的样本(这可能在计算上是昂贵的),而其他一些采样技术则可以处理小得多的样本。

本文建议,相对于基于引导程序的套袋,天真地削减样本数量可能会降低性能,这可能是不这样做的原因。本文还介绍了一种在装袋估算中使用较小样本的新颖方法,同时避免了这些问题。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.