Answers:
插入符包可以帮助您优化问题的参数选择。caretTrain插图展示了如何使用10倍重复交叉验证来调整gbm参数-其他可用的优化方法都可以使用foreach包并行运行。使用vignette("caretTrain", package="caret")
读取文件。
软件包支持调谐shrinkage
,n.trees
和interaction.depth
参数的GBM模型,虽然你可以添加自己的。
对于启发式方法,这是我的初始方法:
shrinkage
:只要您有时间(gbm手册对此有更多介绍,但总的来说,使用较小的值就不会出错)。您的数据集很小,所以我可能会从1e-3开始
n.trees
:我通常会建立一个初始模型,添加越来越多的树,直到gbm.perf
说我有足够的树(实际上,通常是该值的1.2倍),然后以此为指导进行进一步的分析。
interaction.depth
:您已经对此有所了解。也尝试较小的值。最大值为floor(sqrt(NCOL(data))。
n.minobsinnode
:我发现调整此变量非常重要。您不希望它如此之小,以至于算法发现太多的虚假特征。