您好,我正在使用 keras 开发神经网络模型,并且我有 45 个数值预测变量的数据,2 个分类目标将使用不同的模型进行预测。正如我发现的那样,keras 中没有特征重要性模型。我可以使用三个选项,变量之间的相关比、kendals 秩系数值和套索规则。您认为哪一种适合用于神经网络中的特征选择?
神经网络中的特征重要性
数据挖掘
神经网络
喀拉斯
特征选择
特征工程
相关性
2022-02-25 15:39:18
3个回答
不幸的是,没有直接的方法来评估神经网络中变量的“重要性”。一个非常耗时的选项包括逐个删除每个变量,用随机噪声替换它,并检查性能如何变化。这将使您对变量的贡献有所了解。
或者,坚持使用基于树的模型(如随机森林)的重要性分数,或使用良好的旧统计分析。Shapley 值回归就是一个著名的例子。
对于特征重要性,您可能需要考虑使用 Shapley 值或 LIME。这里有一些例子。
为了补充其他两个答案,您可以使用各种与模型无关的方法来评估特征重要性。请参阅这本不错的电子书:可解释的机器学习 - Christoph Molna 制作的黑盒模型可解释指南