为什么 P>0.5 截止对于逻辑回归不是“最佳”?

机器算法验证 物流 预测模型 不平衡类
2022-01-26 17:23:23

前言:我不关心是否使用截止点的优点,或者应该如何选择截止点。我的问题纯粹是数学问题,出于好奇。

逻辑回归对 A 类与 B 类的后验条件概率进行建模,并拟合后验条件概率相等的超平面。所以理论上,我知道无论设置平衡如何,0.5 分类点都会最小化总错误,因为它对后验概率进行建模(假设您始终遇到相同的类别比率)。

在我的现实生活示例中,我使用 P > 0.5 作为我的分类截止值(大约 51% 的准确度)获得了非常差的准确度。但是,当我查看 AUC 时,它高于 0.99。因此,我查看了一些不同的截止值,发现 P > 0.6 给了我 98% 的准确率(小类为 90%,大类为 99%)——只有 2% 的案例被错误分类。

这些类严重不平衡(1:9),这是一个高维问题。但是,我将类平均分配给每个交叉验证集,以便模型拟合和预测之间的类平衡之间不应该存在差异。我还尝试使用来自模型拟合和预测的相同数据,并且发生了同样的问题。

我对 0.5 不会最小化错误的原因很感兴趣,我认为如果模型通过最小化交叉熵损失来拟合,这将是设计使然。

有人对为什么会发生这种情况有任何反馈吗?是否由于增加了惩罚,如果是这样,有人可以解释发生了什么吗?

2个回答

您不必从逻辑回归模型中获取预测类别。保持预测的概率会很好。如果您确实获得了预测的类别,则不应使用该信息来做任何事情,而只能说“此观察最好归入此类别”。例如,您不应使用“准确度”/正确百分比来选择模型。

说了这些话,.50很少会成为分类观察的最佳截止值。为了直观地了解这种情况是如何发生的,想象一下你有ñ=10099正面类别中的观察。一个简单的仅拦截模型可以很容易地拥有49使用时出现误报.50作为你的截止。另一方面,如果您只是将所有内容都称为正面,那么您将拥有1假阳性,但99%正确的。

更一般地说,逻辑回归试图将观察结果的真实概率作为解释变量的函数拟合。它不是试图通过将预测概率集中在.50隔断。如果您的样品不是50%积极的,没有理由.50将最大化正确率。

我认为,这可能是由于多种原因:

  1. 您的数据中可能存在非线性,因此线性添加权重可能并不总是会产生正确的概率
  2. 变量是良好预测变量和弱预测变量的混合体,因此得分约为 0.5 的总体是因为预测变量较弱或强预测变量的影响较小。当你往上走时,你会看到预测变量对他们的影响很大的人

因此,您可能不得不在某个时候使用截止值,以最大化您想要的输出,如精度、准确性等。因为大多数时候人口不是很同质。