每个特征在分类中的贡献?

数据挖掘 机器学习 nlp
2021-09-25 05:32:39

我有一些功能,我正在使用 Weka 对我的实例进行分类。

例如我有:

Number of adj number of adverb number of punctuation

在我的功能集中。但是,我想知道功能集中每个功能的贡献。那么哪些指标或参数有助于获得特征的贡献呢?

1个回答

这称为特征排序,与特征选择密切相关。

  • 特征排名=确定任何单个特征的重要性
  • 特征选择 = 选择相关特征的子集用于模型构建。

因此,如果您能够对特征进行排名,则可以使用它来选择特征,并且如果您可以选择有用特征的子集,那么您至少可以通过删除无用的特征进行部分排名。

这个维基百科页面和这个Quora 帖子应该提供一些想法。过滤器方法与基于包装器的方法与嵌入式方法的区别是最常见的一种。


一种直接的近似方法是将特征重要性与树木的森林一起使用:

在此处输入图像描述

其他常用方式:

如果您使用 scikit-learn,请查看module-sklearn.feature_selection我猜Weka有一些类似的功能。