什么是二元分类器的判别阈值?

数据挖掘 分类 图表 分类器
2021-10-12 09:50:38

关于ROC,谁能告诉我“二元分类器系统的判别阈值”这句话是什么意思?我知道二元分类器是什么。

2个回答

只是补充一点。

就像之前提到的那样,如果您有一个分类器(概率),您的输出是一个概率(0 到 1 之间的数字),理想情况下,您想说大于 0.5 的所有内容都属于一类,小于 0.5 的内容属于其他类。

但是,如果您对癌症发生率进行分类,您会非常关注假阴性(告诉某些人他没有癌症,但实际上他确实患有癌症),而假阳性(告诉某人他确实患有癌症,而实际上他没有患癌)并不那么重要( IDK - 被告知您患有癌症可能在心理上非常昂贵)。因此,您可能会人为地将阈值从 0.5 移动到更高或更低的值,以改变模型的总体灵敏度。

通过这样做,您可以为不同的阈值生成 ROC 图。

分类器通常返回属于某个类的概率。例如,在逻辑回归中,预测值是属于非参考类的预测概率或Pr(Y=1). 判别阈值只是将观察值分配给每个类别的预测概率的截止值。