数据挖掘 - 分数或概率作为训练标签 - 吾爱随笔录

这是一个在我的道路上出现过几次的问题，我还没有一个令人满意的解决方案。目标是根据一些预测概率或分数，其中我们的训练具有这些概率或分数，因此在域中，而不是。我的问题是关于我的损失函数。在分数的情况下，如果 0.4 和 0.5 之间的误差和 0.89 和 0.99 之间的误差相同，如果我想预测期望值，我可以使用 MSE。 $x$ $y$ $[0,1]$ $\{0,1\}$

如果我们希望像分类问题一样处理概率，其中 0.89 和 0.99 之间的差异远大于 0.4 和 0.5 之间的差异，我们希望将其放入我们的损失函数中。中输入分数，交叉熵是否仍然正常工作？ $y$

$\mathcal{L}(y,\hat{y})=-y\log(\hat{y}) - (1-y)\log(1-\hat{y})$

假设我们的并且我们当前的预测是我们会得到： $y=0.5$ $\hat{y}=0.6$

$\mathcal{L}(0.5,0.6)=-0.5\log(0.6) - 0.5\log(0.4)$

我真的不明白为什么会出错？该函数仍然是凸的。但是，它到处都说目标应该在中。也许我的数学缺乏或者我错过了一些明显的东西，为什么这是一个坏主意？ $\{0, 1\}$