我有 3 个二元 Logistic 回归图,我想更好地了解正在发生的事情并了解使模型更好的策略

数据挖掘 机器学习 分类 逻辑回归 阶级失衡 概率校准
2022-01-25 19:32:53

我的问题如下:我有一个二元逻辑回归模型,其数据集非常不平衡,输出预测的百分比。从图像中可以看出,随着阈值的增加,它会停止预测某个点。我正在研究校准技术以尝试使其更好地工作,但我想也许我可以在这里找到一些方向。

我尝试过给课程赋予权重,但似乎并没有变得更好。

是概率校准问题吗?

下面的三个图表没有按特定顺序显示。

提前致谢。

1 2 3

1个回答

给定一个混淆矩阵:

            predicted
            (+)   (-)
            ---------
       (+) | TP | FN |
actual      ---------
       (-) | FP | TN |
            ---------

我们知道:

Precision = TP / (TP + FP)
Recall = TP / (TP + FN)

从图像中可以看出,随着阈值的增加,某个点会停止预测

那不是真的,它只停止准确预测一个类。什么是不可理解的,因为您移动了阈值以对其他班级做出所有预测。

不要自己优化这个,例如随机森林会隐式地为你做这个,(确定截止水平)或者你自己做超参数优化。