不规则的精确召回曲线

数据挖掘 scikit-学习 评估
2021-10-13 07:15:22

我希望对于精确召回曲线,精确度会降低,而召回率会单调增加。我的情节不流畅,看起来很有趣。我使用 scikit 学习绘制曲线的值。下面的曲线是否异常?如果是,考虑到 scikit learn 自动对真实标签和预测标签进行排序,为什么以及如何纠正它。如果情节没问题,我该如何最好地解释这种行为? 在此处输入图像描述

1个回答

这绝对是可能的。当您降低阈值时,您将永远不会降低召回率(您只能将更多正面示例标记为正面)。Precision 正在查看您积极标记的所有示例,以及真正积极的部分。这意味着当您降低阈值时,您可能不会添加任何真阳性,而只会添加假阳性,从而降低精度。让我们看一个虚构的例子,其中 P 为正,N 为负。样本按分数/概率排序。阈值之前的所有内容都被标记为正:

PPNPNNPNNN

如果我们将阈值放在第 2 项和第 3 项之间,我们得到的精度为 1 和回忆 0.5

PP - NPNNPNNN

当我们把它放在项目 3 和 4 之间时,我们保持相同的召回率,但我们的精度下降到 0.6667

PPN - PNNPNNN