对数损失(交叉熵)的参考?

机器算法验证 参考 交叉熵 计分规则 对数损失
2022-03-07 00:09:34

我正在尝试追踪对数损失的原始参考(对数评分规则,交叉熵),通常定义为:

Llog=ytruelog(p)+(1ytrue)log(1p)

例如,对于 Brier 分数,有Brier (1950)文章。对数损失有这样的参考吗?

2个回答

我能找到的最早的是

好,IJ“理性决策”。皇家统计学会杂志。B 系列(方法论),第一卷。14,没有。1,1952 年,第 107-114 页。JSTOR,www.jstor.org/stable/2984087

查看第 8 节“公平费用”:

通过它自己logp1(或者log(1p1)) 是对概率估计的优劣的度量

我在Gneiting & Raftery (2007, JASA )中找到了这个参考,他们写道“这个评分规则至少可以追溯到 Good (1952)”,这表明他们已经对原始来源进行了类似的搜索。

如果我们认为最小化交叉熵等同于最大化同一模型的对数似然,那么我相信我们可以追溯到 RA Fisher。这将日期置于 1912 年和 1922 年之间,具体取决于您希望该理论发展到何种程度;请参阅 John Aldrich “RA Fisher 和 1912 – 1922 年最大似然的形成”统计科学中的讨论。1997 年,卷。12、3号、162-176

我们也有一些相关的线程:

它使用广义上的“交叉熵”一词,而不是本文中使用的含义,作为二进制数据模型的特定损失的术语