[注意:请参阅下面的更新1。]我发现的方法rpart
要比解释起来容易得多party
。但是,后者要复杂得多,并且可能会提供更好的模型。我有时解释的方式party
是说它是产生局部线性(或GLM)模型的基础。我通过指出rpart
所有落入叶节点的元素(即,由分割线界定的盒子/区域)的结果是恒定的来对此进行说明。即使通过本地模型可能有所改进,但您只能得到恒定的预测。
相反, party
开发拆分以潜在地优化区域模型。实际上,它使用的是不同于模型最优性的标准,但是您需要衡量自己的能力来解释差异,以确定是否可以很好地解释它。研究人员可以party
轻松获取有关其论文的信息,但对于不愿考虑使用简单方法(例如随机森林,增强等)的人来说可能会充满挑战。在方法论和结果方面进行了解释,它们为引入更复杂的基于树的模型提供了不错的垫脚石。
简而言之,我想说的是您必须做rpart
的很清楚,您可以使用它party
来提高准确性/性能,但是我不会在不介绍的party
情况下进行介绍rpart
。
更新1.我的答案基于对party
一两年前的理解。它已经成长了很多,但是我会修改我的回答,说我仍然建议rpart
您简洁明了,如果“花哨的”成为客户/合作者的重要标准,我还是会建议的。但是,party
在将某人介绍给之后,我将尝试迁移到使用更多功能rpart
。最好在简单的上下文中以损失函数,分割条件等为起点,然后再引入涉及更多涉及概念的软件包和方法。