有什么方法可以确定分类器有多少信心?

数据挖掘 机器学习 分类 数据挖掘 多类分类
2022-03-13 16:42:06

假设我们有两个分类器(C1,C2)和两个类(A,B)。这些分类器为我们提供了每个实例的每个类的归属概率。假设我们有一个实例X,它实际上应该被分类为A。C1分类结果是(1, 0),C2分类结果是(0.9,0.1),这意味着他们都正确地将X分类为A。显然C1更有信心. 有什么方法可以用来比较我的分类器吗?

2个回答

有许多措施隐含地考虑了预测的置信度。一种非常常见的是对数损失(也称为交叉熵)。

log P(yt|yp)=(yt log(yp)+(1yt) log(1yp))

使用这个度量,自信的正确分类比相对不太自信的正确分类得到更多的奖励,而自信的错误分类则受到严厉的惩罚。

任何适当的评分规则在应用于分类问题时都符合此标准。

其他一些例子是:

以及无数其他相关功能。

除了按照 Thomas 的建议比较日志概率之外,您还可以运行交叉验证并比较模型错误的均值和标准差。然后可以使用基本统计数据来比较这些分布。