机器算法验证 - 监督学习与统计决策理论中的损失函数 - 吾爱随笔录 - 问答

监督学习与统计决策理论中的损失函数

机器算法验证机器学习损失函数决策理论

2022-04-05 13:49:33

我对统计决策理论与机器学习中损失函数的不同定义感到困惑。

在统计决策理论中，损失函数通常定义为 $L(\theta, \delta(X))$ ，在哪里 $\theta$ 是真实的未知参数， $\delta(.)$ 是决策规则，并且 $X$ 是数据（生成自 $\theta$ ？）。例如，参见统计理论课的讲座。

在机器学习中，损失函数似乎定义为 $L(y, f(X))$ ，在哪里 $y$ 是真正的标签并且 $f(x)$ 是一些模型。例如，参见统计学习要素第 2.4 章。

我的问题是他们是否在谈论同一件事。好像不一样。例如，如果我要预测未知硬币的下一次抛硬币，那么我可以将抛硬币建模为遵循具有未知参数的伯努利分布 $\theta$ .

让 $X$ 是一些历史数据。然后似乎统计决策理论的损失函数正在计算我的预测 $\delta(X)$ 针对未知参数 $\theta$ 而在 ML 中，它正在计算相同的预测 $\delta(X)$ （或者 $f(X)$ ) 反对真实标签？

我很难调和这两个概念。

1个回答

我想说这更多的是决定形式上的差异，而不是损失。两种情况下的损失函数都是损失（真实的自然状态，你的决定），但根据决策的形式，它的简化方式不同

在点预测设置中（比如很多 ML），决策是标签的潜在值，自然状态有效地简化为标签的真实值，因此损失 $L(y, \hat y)$ 可以写成预测的损失 $\hat y$ 当真相是 $y$ .

在参数推理设置中，决策是参数的潜在值，自然状态有效地简化为真实的参数值，因此损失 $L(\theta, \hat\theta)$ 可以写成估计的损失 $\hat\theta$ 当真相是 $\theta$ .

还有更复杂的设置。例如，您的决定可能是一个区间，自然状态可能是一个值，损失可能是区间的长度加上从该值到区间最近点的距离（可能为零）[PDF] . 在这种情况下，潜在决策和潜在自然状态之间没有很好的对应关系，并且损失不会以同样的方式简化为决策中的错误摘要。当然还有许多其他的可能性。

其它你可能感兴趣的问题

上一篇不确定性与可变性的常客解释是什么？下一篇多级模型或简单相关系数