数据挖掘 - 我有 3 个二元 Logistic 回归图，我想更好地了解正在发生的事情并了解使模型更好的策略 - 吾爱随笔录

我有 3 个二元 Logistic 回归图，我想更好地了解正在发生的事情并了解使模型更好的策略

数据挖掘机器学习分类逻辑回归阶级失衡概率校准

2022-01-25 19:32:53

我的问题如下：我有一个二元逻辑回归模型，其数据集非常不平衡，输出预测的百分比。从图像中可以看出，随着阈值的增加，它会停止预测某个点。我正在研究校准技术以尝试使其更好地工作，但我想也许我可以在这里找到一些方向。

我尝试过给课程赋予权重，但似乎并没有变得更好。

是概率校准问题吗？

下面的三个图表没有按特定顺序显示。

提前致谢。

1个回答

给定一个混淆矩阵：

            predicted
            (+)   (-)
            ---------
       (+) | TP | FN |
actual      ---------
       (-) | FP | TN |
            ---------

我们知道：

Precision = TP / (TP + FP)
Recall = TP / (TP + FN)

从图像中可以看出，随着阈值的增加，某个点会停止预测

那不是真的，它只停止准确预测一个类。什么是不可理解的，因为您移动了阈值以对其他班级做出所有预测。

不要自己优化这个，例如随机森林会隐式地为你做这个，（确定截止水平）或者你自己做超参数优化。

其它你可能感兴趣的问题

上一篇怀疑文本分类问题的范围下一篇如何生成恰好包含 N 个单词的句子？