数据挖掘 - 有什么方法可以确定分类器有多少信心？ - 吾爱随笔录

有什么方法可以确定分类器有多少信心？

数据挖掘机器学习分类数据挖掘多类分类

2022-03-13 16:42:06

假设我们有两个分类器（C1，C2）和两个类（A，B）。这些分类器为我们提供了每个实例的每个类的归属概率。假设我们有一个实例X，它实际上应该被分类为A。C1分类结果是(1, 0)，C2分类结果是(0.9,0.1)，这意味着他们都正确地将X分类为A。显然C1更有信心. 有什么方法可以用来比较我的分类器吗？

2个回答

有许多措施隐含地考虑了预测的置信度。一种非常常见的是对数损失（也称为交叉熵）。

$-log \space P(y_t|y_p) = -(y_t \space log(y_p) + (1-y_t)\space log(1-y_p))$

使用这个度量，自信的正确分类比相对不太自信的正确分类得到更多的奖励，而自信的错误分类则受到严厉的惩罚。

任何适当的评分规则在应用于分类问题时都符合此标准。

其他一些例子是：

惊喜
Brier 分数（如 darXider 在他的评论中提到的）
球形评分规则
对数评分规则

以及无数其他相关功能。

除了按照 Thomas 的建议比较日志概率之外，您还可以运行交叉验证并比较模型错误的均值和标准差。然后可以使用基本统计数据来比较这些分布。

其它你可能感兴趣的问题

上一篇在 SAS 中显示日期下一篇在 n 个不同的值上进行特征选择