Answers:
不,不是目前的形式。问题在于,不能使凸损失函数对离群值的污染具有鲁棒性(这是自70年代以来众所周知的事实,但是会定期重新发现,例如,有关最近的这种重新发现,请参阅本文):
http://www.cs.columbia.edu/~rocco/Public/mlj9.pdf
现在,在使用回归树的情况下,可以使用CART使用边际(或单变量投影)这一事实:人们可以想到一种CART版本,其中的sd标准被更强大的副本(MAD或更优, Qn估算器)。
最近,我碰到了一份较旧的论文,该论文实现了上述建议的方法(使用健壮的M估计量而不是MAD)。这将使CART / RF的“ y”离群值具有鲁棒性(但不会赋予位于设计空间上的离群值,这会影响模型超参数的估计值)请参阅:
Galimberti,G.,Pillati,M.和Soffritti,G.(2007)。基于M估计的稳健回归树。Statistica,LXVII,173-190。
您可能会考虑使用Breiman的套袋或随机森林。一个很好的参考书是Breiman的“装袋预测器”(Bagging Predictors)(1996年)。在《统计手册》中克利夫顿·萨顿(Clifton Sutton)的“分类和回归树,装袋和增强”中也进行了总结。
您还可以查看Andy Liaw和Matthew Wiener R News对randomForest软件包的讨论。