我的问题如下:我有一个二元逻辑回归模型,其数据集非常不平衡,输出预测的百分比。从图像中可以看出,随着阈值的增加,它会停止预测某个点。我正在研究校准技术以尝试使其更好地工作,但我想也许我可以在这里找到一些方向。
我尝试过给课程赋予权重,但似乎并没有变得更好。
是概率校准问题吗?
下面的三个图表没有按特定顺序显示。
提前致谢。
我的问题如下:我有一个二元逻辑回归模型,其数据集非常不平衡,输出预测的百分比。从图像中可以看出,随着阈值的增加,它会停止预测某个点。我正在研究校准技术以尝试使其更好地工作,但我想也许我可以在这里找到一些方向。
我尝试过给课程赋予权重,但似乎并没有变得更好。
是概率校准问题吗?
下面的三个图表没有按特定顺序显示。
提前致谢。
给定一个混淆矩阵:
predicted
(+) (-)
---------
(+) | TP | FN |
actual ---------
(-) | FP | TN |
---------
我们知道:
Precision = TP / (TP + FP)
Recall = TP / (TP + FN)
从图像中可以看出,随着阈值的增加,某个点会停止预测
那不是真的,它只停止准确预测一个类。什么是不可理解的,因为您移动了阈值以对其他班级做出所有预测。
不要自己优化这个,例如随机森林会隐式地为你做这个,(确定截止水平)或者你自己做超参数优化。