套袋的理论保证是什么


17

我(大约)听说:

套袋是一种减少预测器/估计器/学习算法的方差的技术。

但是,我从未见过这种说法的正式数学证明。有谁知道为什么这在数学上是正确的?似乎这是一个广为接受/已知的事实,我希望直接引用它。如果没有,我会感到惊讶。另外,有人知道这对偏差有什么影响吗?

是否有任何其他理论上的保证可以保证任何人都知道并认为很重要并想分享的方法?

Answers:


21

套袋的主要用例是通过将低偏差模型捆绑在一起来减少它们的差异。Bauer和Kohavi在具有里程碑意义的论文投票分类算法的实证比较:装袋,提升和变体 ”中对此进行了经验研究。它通常按广告宣传工作。

但是,与普遍看法相反,装袋不能保证减少差异。最近(我认为)更好的解释是,套袋可减少杠杆作用点的影响。杠杆点是那些对结果模型产生不成比例影响的杠杆点,例如最小二乘回归中的离群值。杠杆点很少会积极影响最终的模型,但这种情况下套袋会降低性能。看一看Grandvalet的套袋平等影响

因此,最后回答您的问题:套袋的效果很大程度上取决于杠杆点。几乎没有理论上的保证,只是装袋线性增加了装袋尺寸的计算时间!也就是说,它仍然是一种广泛使用且非常强大的技术。例如,在学习标签噪声时,装袋可以产生更强大的分类器

Rao和Tibshirani给予的Bayesian解释外的引导方法,进行模型平均和选择

从这个意义上讲,自举分布表示参数的(近似)非参数,非信息后验分布。但是,可以毫不费力地获得该自举分布-无需正式指定先验条件,也不必从后验分布中取样。因此,我们可能会认为引导分布是穷人的“贝叶斯后验”。


1
“杠杆点”的解释如何应用于经常被推荐用于装袋的树木?虽然很明显线性回归中有哪些高杠杆点,但是对于树而言,这些点是什么?
DavidR

找到了另一个有关此问题的参考:quora.com / ...您 怎么看?这与您所说的理论上不会减少方差的事实相矛盾吗?
查理·帕克

我看到维基百科说套袋(aka引导聚合)降低了差异。如果没有任何理论依据,是否表示该文章有误?
查理·帕克

在大多数情况下,装袋的方差较小,但这不是其实际机制。Grandvalet展示了增加方差的示例,并说明了该机制与均衡化对数据有重大影响的数据点的影响更紧密相关,例如最小二乘回归中的异常值,这在大多数情况下会减小方差。
马克·克莱森
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.