我有一个包含 24 个预测变量的数据集,它们都是连续的,但具有不同的尺度和潜在的共线性。我正在尝试决定是使用条件重要性排列randomForest
还是cforest
参加派对。
我认识到如果我想克服变量选择偏差,我可能应该使用cforest
它,但我发现从包中获得部分依赖图和百分比方差的能力randomForest
非常吸引人。
我想知道是否有人知道是否有可能得到部分依赖图和百分比方差解释cforest
?
此外,似乎ctree
使用显着性检验来选择变量;这是一样的cforest
吗?以及如何获得 cforest 中每个变量的这些显着性值?