1
通过添加更多的单个决策树来进行在线随机森林
随机森林(RF)由决策树(DT)的集合创建。通过使用装袋,可以在不同的数据子集中训练每个DT。因此,有没有办法通过在新数据上添加更多决策树来实现在线随机森林? 例如,我们有10K样本并训练了10个DT。然后,我们得到了1K个样本,而不是再次训练整个RF,而是添加了一个新的DT。现在通过10 + 1 DT的贝叶斯平均值进行预测。 另外,如果我们保留所有先前的数据,则可以主要在新数据中训练新的数据仓库,其中根据已经选择了多少次来加权选择样本的概率。