如何解释分类分数?

数据挖掘 分类 优化 可能性 分数
2022-03-04 16:16:38

我想知道如何解释分类分数(我不确定分数或概率这个词,请纠正我)。例如,对于二元分类,正值标记为 1,负值标记为 -1。现在,公平地说,对于得分 10,实例比得分 5 更有可能被成功预测,尽管结果可能是错误的。

谢谢。

2个回答

如果分数的值高于 1,我不会称它们为概率。概率应始终介于 0 和 1 之间。

事实上,分数越高,一个例子就越有可能是正面的,这是对分数最自然的解释。

我将尝试回答您的困惑,但不是个人“如何”,即决策树如何计算概率等。您可以搜索互联网,例如“决策树如何工作等”。


分数主要用于描述模型的整体预测结果。根据预测类型和一些其他特定条件,有许多不同的技术,例如准确度、RMS、ROCAUC等指标。


概率告诉我们模型对其预测的信心程度。
不同的模型有不同的技术来计算概率,但用一种非常简单的语言来说,它与模型从训练数据中学习到的数据点与决策边界的距离成正比。

如图所示,上面的红圈将更有可能是“黄色”

在此处输入图像描述

公平地说,对于得分 10,实例比得分 5 更有可能被成功预测

的,您可以看到,由于模型偏差,较低的红圈点更有可能被漏分类。