我已经使用以下方法构建了一个二元分类模型:
- 罗吉特
- 决策树
- 随机森林
- 装袋分类器
- 梯度提升
- xgboost
- adaboost
我已经评估了上述模型,并根据训练/测试和验证指标(准确度、预测、召回、f1 和 AUC)选择了 xgboost。
我现在想将其生产化并与企业共享输出。输出基本上会有一个带有预测类的项目列表,并且可以根据业务需求进行过滤。
但是,我不想简单地为企业提供预测的类别,而是添加关于为什么预测特定项目为 X 类别的见解/建议,以及如何着手处理该项目以将其类别从 X 更改为 Y。
我该怎么做?我想过使用特征重要性,但我的输入数据形状是 [800,000 * 1,050],我不确定这是否是最好的方法。
是否有任何现有的行业标准方法可以为此类模型添加可解释性并将它们从黑盒模型转换为规范模型?