我正在使用bigrf
R 包来分析带有 ca 的数据集。50.000 个观测值 x 120 个变量,分为两组。
在种植了 1000 棵树的森林之后,我分别使用fastimp
和interactions
函数调查了 120 个特征与 2 个类的关系的重要性和关系,这产生了非常好的结果。
但是,我现在有兴趣使用 3 个(或更多)而不是 2 个类来调查问题。在这种情况下,计算的基尼变量重要性fastimp
仅与整体重要性有关。
我的问题是:有没有办法计算特定类别的 Gini 变量重要性或类似的度量?