数据挖掘 - 模型在 x 值处预测属于第 1 类概率的原因 - 吾爱随笔录

全部，

这是一个普遍的问题。我有一个二进制分类来预测某人是否富有。我有一个问题，有人问如果某人富有的概率是 0.6 并且另一个人也被赋予了这个概率，那么他们为什么富有的原因是一样的？

我正在使用 xgboost，我的直觉是拒绝。例如，如果我要分析每个人口 > = 0.5、>= 0.6、...等，我会发现他们的特征有什么不同吗？我会说这很难，因为大多数时候结果和目标之间没有线性关系，它可能很复杂。

一般来说，我想我的问题是：如果两个人被赋予相同的 1 类概率 - 给这些人中的每个人这个 0.6 的模型原因是否相同？“原因”是特征/特征值