randomForest 与 cforest;我可以得到包装派对中解释的部分依赖图和百分比方差吗?

机器算法验证 r 随机森林
2022-03-21 16:36:51

我有一个包含 24 个预测变量的数据集,它们都是连续的,但具有不同的尺度和潜在的共线性。我正在尝试决定是使用条件重要性排列randomForest还是cforest参加派对。

我认识到如果我想克服变量选择偏差,我可能应该使用cforest它,但我发现从包中获得部分依赖图和百分比方差的能力randomForest非常吸引人。

我想知道是否有人知道是否有可能得到部分依赖图和百分比方差解释cforest

此外,似乎ctree使用显着性检验来选择变量;这是一样的cforest吗?以及如何获得 cforest 中每个变量的这些显着性值?

2个回答

我的包edarf将使用cforest. varimp您也可以使用派对包中的函数进行排列。

yes生成与在每个节点处选择的随机特征和子采样(默认情况下)具有cforest相同形式的树的集合。ctree控制 via 的参数cforest_control如果您从 cran 页面下载源代码,您可以看到所有相关代码,其中大部分是用 C 编写的,但可读性很强。

您现在可以使用mlr包为 R 中的任何学习器制作部分依赖图。这里是解释如何做到这一点的教程包:教程