我有一个由 4 个类和大约 200 个特征组成的数据集。我已经实现了一个高斯朴素贝叶斯分类器。我现在想根据高斯朴素贝叶斯分类器计算每对类的每个特征的重要性。最后,我想可视化每对类的 10 个最重要的特征。这意味着对于 1 类和 2 类,我想要特征 1、特征 2 等的重要性。
我的建议是计算对于每一对类。
我已经计算了每个特征和每个类的均值和方差。这意味着我对 200 个特征和 4 个类中的每一个都有一个均值和方差。采用正态分布,我可以对新数据点进行分类。
您现在将如何计算特征重要性度量?
假设我们计算,这意味着第一个特征() 和第 1 类和第 2 类,所以它应该给出第 1 类和第 2 类的第一个特征的重要性。
我有第 1 类和第 2 类的第一个特征的正态分布,但我应该如何计算概率,即,我应该在什么时候评估正态分布?