logloss的直观解释

机器算法验证 解释 直觉 损失函数
2022-03-23 07:32:07

在几场 kaggle 比赛中,评分是基于“logloss”。这与分类错误有关。

这是一个技术答案,但我正在寻找一个直观的答案。我真的很喜欢这个关于马氏距离的问题的答案,但 PCA 不是对数损失。

我可以使用我的分类软件输出的值,但我不是很了解它。为什么我们使用它而不是真/假阳性/阴性率?你能帮我解释一下我的祖母或该领域的新手吗?

我也喜欢并同意这句话:

除非你能向你的祖母解释,否则你不会真正理解某事
——阿尔伯特·爱因斯坦

在发帖之前,我尝试自己回答这个问题。

我没有发现直观或真正有用的链接包括:

这些信息丰富且准确。它们适用于技术观众。他们没有画出简单的图画,也没有给出简单易懂的例子。它们不是写给我祖母的。

1个回答

对数损失是所有概率乘积的对数。假设爱丽丝预测:

  • 以 0.2 的概率,约翰会杀死杰克
  • 以 0.001 的概率,玛丽将嫁给约翰
  • 比尔是凶手的概率为 0.01。

原来玛丽没有嫁给约翰,比尔不是凶手,而是约翰杀了杰克。根据 Alice 的说法,概率的乘积是 0.2*0.999*0.99=0.197802

鲍勃预测:

  • 以 0.5 的概率,约翰会杀死杰克
  • 以 0.5 的概率,玛丽将嫁给约翰
  • 比尔是凶手的概率为 0.5。

乘积为 0.5*0.5*0.5=0.125。

Alice 是比 Bob 更好的预测者。