具体来说,对于哪些模型类以及在哪些情况下调整分类器以优化对数丢失率是合理的?
什么时候对数损失度量适合评估分类器的性能?
机器算法验证
物流
分类
模型评估
2022-04-09 13:29:45
2个回答
当您的模型输出是二元结果的概率时,对数损失是一种适当的性能度量。
在评估如何惩罚错误分类时,对数损失度量会考虑预测的置信度。例如,考虑对结果 P(Y=1|X) 的两个预测,其中预测分别为 0.51 和 0.99。在前一种情况下,模型对类预测只有一点信心(假设截止值为 0.5),而在后一种情况下,它非常有信心。由于在我们的例子中,两者都是错误的,因此通过使用对数损失惩罚,对于更自信(但不正确)的预测,惩罚将更加严厉。
如果你想要一个好的概率估计来惩罚错误的极端值,那么 logloss 可以做到这一点。
阅读更多关于理解对数损失的信息。
对数损失会严重惩罚对错误分类有信心的分类器。例如,如果对于特定的观察,分类器将非常小的概率分配给正确的类,那么对 Log Loss 的相应贡献确实会非常大。自然,这将对分类器的整体 Log Loss 产生重大影响。底线是,犯一些错误总比严重错误好。当然,完全正确总是更好,但这在实践中很少能实现!
其它你可能感兴趣的问题