全部,
这是一个普遍的问题。我有一个二进制分类来预测某人是否富有。我有一个问题,有人问如果某人富有的概率是 0.6 并且另一个人也被赋予了这个概率,那么他们为什么富有的原因是一样的?
我正在使用 xgboost,我的直觉是拒绝。例如,如果我要分析每个人口 > = 0.5、>= 0.6、...等,我会发现他们的特征有什么不同吗?我会说这很难,因为大多数时候结果和目标之间没有线性关系,它可能很复杂。
一般来说,我想我的问题是:如果两个人被赋予相同的 1 类概率 - 给这些人中的每个人这个 0.6 的模型原因是否相同?“原因”是特征/特征值