我使用两种方法执行特征选择:MDI(随机森林重要性)和特征排列,以便比较哪些特征被认为与这两种方法相关。我的数据集是完整的分类(值为 0 o 1 的特征)。对于特定特征(例如,最重要的一个),这两种方法获得的重要性分别是0.30和0.039。如果我将累积和应用于两种方法的重要性,我会得到1MDI 和周围0.1的特征排列。我不知道是否期望在这些范围内获得特征排列的值。
随机森林重要性与特征排列:重要性的累积和分别为 1 和 0.1。有道理?
数据挖掘
机器学习
特征选择
2022-03-05 10:57:10
0个回答
没有发现任何回复~