我有两个班级 1 和 2:
的输出model.predict_proba()
:
[0.333,0.6667]
的输出model.predict()
:
1
在 10 lac 的测试数据中,大约有 200 个测试值会发生这种情况。对于所有其他记录,两个函数的输出不冲突。即使第 2 类的概率更高,预测函数也会将最终类别设为 1。
model.predict()
这 200 条记录的输出和model.predict_proba()
不同步的原因可能是什么?
我有两个班级 1 和 2:
的输出model.predict_proba()
:
[0.333,0.6667]
的输出model.predict()
:
1
在 10 lac 的测试数据中,大约有 200 个测试值会发生这种情况。对于所有其他记录,两个函数的输出不冲突。即使第 2 类的概率更高,预测函数也会将最终类别设为 1。
model.predict()
这 200 条记录的输出和model.predict_proba()
不同步的原因可能是什么?
如果你有两个类,即你正在做二进制分类,你应该将目标标签指定为 0 或 1 (neg/pos)。predict_proba() 方法返回样本属于第 1 类的估计概率。
“在二分类情况下,‘1’表示正样本,‘0’表示负样本。我们也支持[0,1]中的概率值作为标签,表示实例存在的概率积极的。”