ROC-AUC 曲线作为没有机器学习算法的二元分类器的度量

数据挖掘 分类 奥克
2022-03-10 07:46:23

也许这是一个微不足道的问题,但我现在有点困惑......我会解释一下:我的数据中有一些元素,每个元素的值都在 0 和 1 之间,并且有一个关联的标签 (1, 0)。我需要测试一些阈值,然后计算 ROC-AUC 曲线。例如阈值 = 0.4,所有大于 0.4 的值都将被预测为真(1),所有低于 0.4 的值都将被预测为假(0),然后我将结果与实际标签进行比较来计算真阳性率和假阳性率,最后构建 ROC-AUC 曲线。

所以,我的问题是,考虑到基于选择的阈值,我已经知道元素将落在哪个预测之下,我不需要机器学习分类器来执行默认的训练和测试阶段,对吧?

1个回答

您的直觉是正确的:您不一定需要机器学习算法来计算 ROC 曲线,而且根据您的说法,您似乎已经具备了必要的成分。

事实上,ROC 曲线在历史上是在与机器学习无关的情况下发展起来的;来自维基百科

ROC 曲线最初由二战期间的电气工程师和雷达工程师开发,用于检测战场上的敌方物体,并很快被引入心理学以解释对刺激的感知检测。从那时起,ROC 分析已在医学、放射学、生物识别学、自然灾害预测、气象学、模型性能评估和其他领域使用了数十年,并且越来越多地用于机器学习和数据挖掘研究。