向分类模型的输出添加建议

数据挖掘 机器学习 Python 分类 数据科学模型
2021-09-17 19:21:29

我已经使用以下方法构建了一个二元分类模型:

  • 罗吉特
  • 决策树
  • 随机森林
  • 装袋分类器
  • 梯度提升
  • xgboost
  • adaboost

我已经评估了上述模型,并根据训练/测试和验证指标(准确度、预测、召回、f1 和 AUC)选择了 xgboost。

我现在想将其生产化并与企业共享输出。输出基本上会有一个带有预测类的项目列表,并且可以根据业务需求进行过滤。

但是,我不想简单地为企业提供预测的类别,而是添加关于为什么预测特定项目为 X 类别的见解/建议,以及如何着手处理该项目以将其类别从 X 更改为 Y。

我该怎么做?我想过使用特征重要性,但我的输入数据形状是 [800,000 * 1,050],我不确定这是否是最好的方法。

是否有任何现有的行业标准方法可以为此类模型添加可解释性并将它们从黑盒模型转换为规范模型?

1个回答

决策树可以用python绘制,这是最可视化的机器学习算法,你可以在这里看到一个链接:https ://medium.com/@rnbrown/creating-and-visualizing-decision-trees-with-python-f8e8fa394176 .

对于其他一切,您需要再次进行数据探索。尝试在条形图中可视化,例如,您可以显示,如果您有“X”类和“Y”类,如果它是 X 类,你的未来 1 的置信区间是多少,如果它是“Y”类怎么办。