XGBOOST:model.predict_proba() 和 model.predict() 冲突行为

数据挖掘 分类 xgboost 预言 监督学习
2022-03-06 19:32:10

我有两个班级 1 和 2:

的输出model.predict_proba()

[0.333,0.6667]

的输出model.predict()

1

在 10 lac 的测试数据中,大约有 200 个测试值会发生这种情况。对于所有其他记录,两个函数的输出不冲突。即使第 2 类的概率更高,预测函数也会将最终类别设为 1。

model.predict()这 200 条记录的输出和model.predict_proba()不同步的原因可能是什么?

1个回答

如果你有两个类,即你正在做二进制分类,你应该将目标标签指定为 0 或 1 (neg/pos)。predict_proba() 方法返回样本属于第 1 类的估计概率。

“在二分类情况下,‘1’表示正样本,‘0’表示负样本。我们也支持[0,1]中的概率值作为标签,表示实例存在的概率积极的。”