WEKA 随机森林 J48 属性重要性

数据挖掘 机器学习 随机森林 决策树 威卡
2022-03-01 23:47:08

我一直在使用 WEKA 对持续时间很长的录音进行分类。表现最好的分类器是随机森林和 J48。用于对音频进行分类的属性是声学指标。生成这些索引的过程非常耗费资源。

我想确定各种属性的重要性。这些分类器有没有办法报告这个?

我看到 J48 生成了一个决策树,在树的根部使用的属性最重要是否安全?

1个回答

如果您必须使用 WEKA,我建议您查看“属性选择”面板。在此面板中,您可以按信息增益对属性进行排名,并查看哪些属性子集表现最佳。据我所知,您无法直接从 WEKA Explorer 中的分类器中获取此信息,但在其他框架中很容易获得此信息,例如scikit-learn:请参阅文档中的此示例