我有一些功能,我正在使用 Weka 对我的实例进行分类。
例如我有:
Number of adj number of adverb number of punctuation
在我的功能集中。但是,我想知道功能集中每个功能的贡献。那么哪些指标或参数有助于获得特征的贡献呢?
我有一些功能,我正在使用 Weka 对我的实例进行分类。
例如我有:
Number of adj number of adverb number of punctuation
在我的功能集中。但是,我想知道功能集中每个功能的贡献。那么哪些指标或参数有助于获得特征的贡献呢?
这称为特征排序,与特征选择密切相关。
因此,如果您能够对特征进行排名,则可以使用它来选择特征,并且如果您可以选择有用特征的子集,那么您至少可以通过删除无用的特征进行部分排名。
这个维基百科页面和这个Quora 帖子应该提供一些想法。过滤器方法与基于包装器的方法与嵌入式方法的区别是最常见的一种。
一种直接的近似方法是将特征重要性与树木的森林一起使用:
其他常用方式:
如果您使用 scikit-learn,请查看module-sklearn.feature_selection。我猜Weka有一些类似的功能。