所以总结一下我所做的事情:
我的数据集有 5 个类和 10 个参数。我使用 sklearn 的 XGBclassifer 来调查是否可以使用这 10 个参数来预测每个数据点的类别。在训练和拟合 XGBclassifier 之后,我检查了 feature_importances_,发现 2/10 参数在分类中起关键作用。
所以我的问题是:
我能否确切了解这两个参数对每个特定类别的分类有何贡献?例如,我能否找到参数 1 和参数 2 的截止值,这将导致对第 1 类的预测?
我正在考虑使用这两个参数和 k 值 = 5 执行无监督聚类。之后,我可以只关注近似截止值。但是,我担心这 5 个集群不会与 5 个组紧密对应。
非常感谢先进