我正在尝试比较几个二元分类器。这些分类器(在我的例子中是高斯过程,但没关系)给了我概率预测。让我们介绍一些符号:
我知道测量概率分类器准确性的两种“经典”方法:
- 0-1 loss:只预测概率最高的类别,并与真实类别进行比较:
- logarithmic loss:考虑类的预测概率。
这对我来说很有意义,因为它是样本的对数似然,在分类器诱导的分布下。
现在我建议使用第三种损失函数,我们称之为“概率损失”:
我有一堆与最后一个损失函数相关的问题:
- 是我自己编的,还是众所周知的损失函数?
- 直观地说,我会将其解释为“预期的”0-1 损失。这有意义吗?
最重要的是:问题在哪里?我很有信心这个损失函数是有缺陷的,但我看不出在哪里以及如何。
注意:这个问题似乎是相关的,特别是对第一个答案的评论。