数据挖掘 - XGBOOST：model.predict_proba() 和 model.predict() 冲突行为 - 吾爱随笔录

数据挖掘分类 xgboost 预言监督学习

2022-03-06 19:32:10

我有两个班级 1 和 2：

的输出model.predict_proba()：

[0.333,0.6667]

的输出model.predict()：

在 10 lac 的测试数据中，大约有 200 个测试值会发生这种情况。对于所有其他记录，两个函数的输出不冲突。即使第 2 类的概率更高，预测函数也会将最终类别设为 1。

model.predict()这 200 条记录的输出和model.predict_proba()不同步的原因可能是什么？

1个回答

如果你有两个类，即你正在做二进制分类，你应该将目标标签指定为 0 或 1 (neg/pos)。predict_proba() 方法返回样本属于第 1 类的估计概率。

“在二分类情况下，‘1’表示正样本，‘0’表示负样本。我们也支持[0,1]中的概率值作为标签，表示实例存在的概率积极的。”

其它你可能感兴趣的问题