我正在研究贝叶斯世界。到目前为止,我已经了解MLE
或MPA
是点估计,因此使用此类模型仅输出一个特定值而不是分布。
此外,vanilla neural networks
实际上做类似的事情MLE
,因为最小化平方损失或交叉熵类似于找到最大化可能性的参数。此外,使用具有正则化的神经网络与 MAP 估计相当,因为先前的工作类似于误差函数中的惩罚项。
但是,我找到了这项工作。这表明权重从惩罚最小二乘法中获得的权重与权重相同通过最大后验获得:
然而,论文说:
"前两种方法产生相似的预测,尽管 MAP 贝叶斯模型确实给出了此分布的均值与经典预测器的均值相同, 自从
我在这里没有得到的是 MAP 贝叶斯如何给出概率分布,当它只是一个点估计?考虑一个神经网络——一个点估计意味着一些固定的权重,那么怎么会有一个输出概率分布呢?我认为这只能在真正的贝叶斯中实现,我们在其中整合未知权重,因此使用所有可能的权重构建类似于所有结果的平均权重的东西。