rpart
[注意:请参阅下面的更新 1。] 我发现party
. 然而,后者要复杂得多,并且可能会提供更好的模型。我有时解释的方式party
是将其称为生成局部线性(或 GLM)模型的基础。我通过指出rpart
落入叶节点的所有元素(即由分割限制的框/区域)的结果是恒定的来建立这一点。即使通过本地模型可能会有所改进,但除了不断的预测之外,您什么也得不到。
相反,party
开发拆分以可能优化区域的模型。它实际上使用了与模型最优性不同的标准,但您需要衡量自己解释差异的能力,以确定您是否能很好地解释它。它的论文对于研究人员来说很容易获得,但对于那些不愿意考虑更简单的方法(如随机森林、提升等)的人来说可能是相当具有挑战性的。在数学上,我认为这party
更复杂......尽管如此,CART 模型更容易解释,无论是在方法论和结果方面,这些都为引入更复杂的基于树的模型提供了一个不错的垫脚石。
简而言之,我会说你必须做rpart
的清晰,你可以使用party
准确/性能,但我不会不介绍party
就介绍rpart
.
更新 1. 我的回答基于我对party
一两年前的理解。它已经长大了很多,但我会修改我的答案,说我仍然推荐rpart
它的简洁性和传统性,如果“非花哨”是您的客户/合作者的重要标准。然而,party
在将某人介绍给rpart
. 在引入涉及更多概念的包和方法之前,最好从简单的上下文中从损失函数、分割标准等开始。