负对数似然损失函数的输入应该是概率吗?

人工智能 深度学习 目标函数 激活函数
2021-10-23 23:06:31

我正在尝试训练一个监督模型,其中模型的输出是线性函数的输出WX+b. 请注意,我没有使用任何 softmax 或logsoftmax 对线性的结果。我正在使用负对数似然损失函数,它将输入作为模型的线性输出和真实标签。通过这样做,我得到了不错的准确性,但我已经读到负对数似然函数的输入必须是概率。难道我做错了什么?

1个回答

这对我来说似乎很合理。您可以针对与负对数似然成比例的任何函数进行优化。传统上,我们假设线性模型下数据的可能性与预测值和观察值之间差异的某种高斯函数成正比。如果您是贝叶斯主义者,您会说这是概率。如果你是一个铁杆常客,你可能会对此表示怀疑,但它仍然是一个介于 0 和 1 之间的数字。

但是,如果您记录此似然函数的对数,您将获得差异的二次函数,其中包含一些您不需要担心的缩放器。所以你应该最小化:

是的(是的-是的^)2

这不是概率,但由于它与原始似然函数的对数成比例(在某种意义上是),因此最小化它也会最小化原始函数。

希望有帮助!