Answers:
主要思想是套袋程序,而不是使树木随机。详细地讲,每棵树都是建立在对象样本上的,该对象是从原始集合中替换而来的。因此,每棵树都有一些未曾见过的对象,这使得整个集合变得更加异构,因此泛化效果更好。
此外,正在以这样的方式削弱树木:在每个分割上仅考虑M(或mtry
)个随机选择的属性;M通常是集合中属性数量的平方根。这样可以确保树木不被过度修剪,因为它们不会被修剪。您可以在此处找到更多详细信息。
另一方面,RF有一个称为“极端随机森林”的变体,其中树是以随机方式制作的(没有拆分的优化)-请参阅,我认为这是参考资料。