如何解释随机森林模型的重要性,Mean Decrease Accuracy 和 Mean Decrease Gini?

数据挖掘 随机森林 特征重要性
2022-03-13 09:23:03

重要性

随机森林模型输出以下重要性值。我如何对它们进行特征选择?如果是平均降低的准确性,这是否意味着通过将它们从模型中删除,准确性应该会提高?

1个回答

我不确定您使用的是哪个软件,所以我不知道细节,但通常很简单:最高值表示对目标贡献最大的功能。

特别是,准确度的平均下降显示了去除这个特征后准确度下降了多少因此,高值(例如emotionality在您的示例中)再次表明预测目标的重要特征。