Questions tagged «online-learning»

1
通过添加更多的单个决策树来进行在线随机森林
随机森林(RF)由决策树(DT)的集合创建。通过使用装袋,可以在不同的数据子集中训练每个DT。因此,有没有办法通过在新数据上添加更多决策树来实现在线随机森林? 例如,我们有10K样本并训练了10个DT。然后,我们得到了1K个样本,而不是再次训练整个RF,而是添加了一个新的DT。现在通过10 + 1 DT的贝叶斯平均值进行预测。 另外,如果我们保留所有先前的数据,则可以主要在新数据中训练新的数据仓库,其中根据已经选择了多少次来加权选择样本的概率。

2
在线机器学习图书馆
我正在寻找软件包(以python,R或独立软件包形式)以执行在线学习以预测库存数据。 我发现并阅读了有关Vowpal Wabbit(https://github.com/JohnLangford/vowpal_wabbit/wiki)的文章,这似乎很有希望,但是我想知道是否还有其他软件包。 提前致谢。

4
SGDClassifier:具有先前未知标签的在线学习/ partial_fit
我的训练集包含大约50k项,我可以通过它们进行初步学习。每周添加约5k条目;但“消失”的数量相同(因为用户数据必须在一段时间后删除)。 因此,我使用在线学习是因为以后无法访问完整的数据集。目前,我正在使用一个SGDClassifier有效的工具,但我遇到了一个大问题:新类别正在出现,现在我不能再使用模型了,因为它们不在最初的模型中fit。 有没有办法使用SGDClassifier其他模型?深度学习? 我现在是否必须从头开始都没关系(即使用以外的东西SGDClassifier),但是我需要一些能够使用新标签进行在线学习的东西。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.