我的问题是关于随机森林。这个美丽的分类器的概念对我来说很清楚,但是仍然存在许多实际使用问题。不幸的是,我没有找到任何有关RF的实用指南(我一直在寻找类似Geoffrey Hinton撰写的“训练受限的Boltzman机器的实用指南”之类的内容,但搜索的是Random Forests!
在实践中如何调整RF?
树木数量越大总会更好吗?是否有合理的限制(当然,除了压缩容量以外),树木数量的增加以及如何针对给定的数据集进行估算?
树木的深度怎么样?如何选择合理的一个?在一个森林中试验不同长度的树木有感觉吗?对此有什么指导?
训练射频时还有其他参数值得一看吗?用于建造单个树木的算法可能是?
当他们说RF能够抵抗过度拟合时,这是真的吗?
我将不胜感激,在搜索过程中可能错过的任何答案和/或指向指南或文章的链接。