我非常熟悉机器学习中的损失函数,但我很难将它们与统计决策理论中的损失函数联系起来 [1]。
在机器学习中,损失函数通常只在训练时考虑。它是两个变量 的可微函数loss(true value, predicted value)
,您可以迭代地最小化训练集以收敛到(局部)最优模型权重。
在统计决策理论中,损失函数似乎与预测时间相关(?)。您希望根据您对其可能值的评估以及做出错误预测的损失来合理地选择未知量的值。
这两个概念如何相互关联的直觉是什么?
[1] 例如,在“机器学习:一种概率方法”的第 6.3 章或“统计学习的要素”的第 2.4 章中。