我一直在使用 WEKA 对持续时间很长的录音进行分类。表现最好的分类器是随机森林和 J48。用于对音频进行分类的属性是声学指标。生成这些索引的过程非常耗费资源。
我想确定各种属性的重要性。这些分类器有没有办法报告这个?
我看到 J48 生成了一个决策树,在树的根部使用的属性最重要是否安全?
我一直在使用 WEKA 对持续时间很长的录音进行分类。表现最好的分类器是随机森林和 J48。用于对音频进行分类的属性是声学指标。生成这些索引的过程非常耗费资源。
我想确定各种属性的重要性。这些分类器有没有办法报告这个?
我看到 J48 生成了一个决策树,在树的根部使用的属性最重要是否安全?
如果您必须使用 WEKA,我建议您查看“属性选择”面板。在此面板中,您可以按信息增益对属性进行排名,并查看哪些属性子集表现最佳。据我所知,您无法直接从 WEKA Explorer 中的分类器中获取此信息,但在其他框架中很容易获得此信息,例如scikit-learn:请参阅文档中的此示例。