抱歉,这个问题的标题含糊不清。我的问题是,有没有办法比较机器学习算法中使用的特征(或属性)?我使用朴素贝叶斯分类器进行二元分类,总共包含 6 个特征。我想将这些特性相互比较,并按照它们在模型中的重要性的优先顺序列出特性(该特性的重要性)。例如,我们使用信息增益或基尼指数来决定特征在 CART 中的有效性。我如何在朴素贝叶斯中进行比较?我读过混淆矩阵和 f 度量,但它们擅长定义模型的优劣而不是特征。
机器学习模型(如朴素贝叶斯)中的特征重要性参数
数据挖掘
机器学习
决策树
朴素贝叶斯分类器
2022-02-14 07:05:49
1个回答
由于朴素贝叶斯假设独立并输出类概率,大多数特征重要性标准不是直接拟合的。特征重要性应该与集合中特征分布的偏度没有什么不同:您可以尝试直接比较给定类的特征概率(例如在 sklearn 中实现),这些概率相对于类的可变性应该表达这些特征的重要性。
其它你可能感兴趣的问题