神经网络中的特征重要性

数据挖掘 神经网络 喀拉斯 特征选择 特征工程 相关性
2022-02-25 15:39:18

您好,我正在使用 keras 开发神经网络模型,并且我有 45 个数值预测变量的数据,2 个分类目标将使用不同的模型进行预测。正如我发现的那样,keras 中没有特征重要性模型。我可以使用三个选项,变量之间的相关比、kendals 秩系数值和套索规则。您认为哪一种适合用于神经网络中的特征选择?

3个回答

不幸的是,没有直接的方法来评估神经网络中变量的“重要性”。一个非常耗时的选项包括逐个删除每个变量,用随机噪声替换它,并检查性能如何变化。这将使您对变量的贡献有所了解。

或者,坚持使用基于树的模型(如随机森林)的重要性分数,或使用良好的旧统计分析。Shapley 值回归就是一个著名的例子。

对于特征重要性,您可能需要考虑使用 Shapley 值或 LIME。这里有一些例子

为了补充其他两个答案,您可以使用各种与模型无关的方法来评估特征重要性。请参阅这本不错的电子书:可解释的机器学习 - Christoph Molna 制作的黑盒模型可解释指南