贝叶斯 MAP 是否给出了未见数据的概率分布?

数据挖掘 机器学习 贝叶斯 贝叶斯网络
2021-09-23 18:10:29

我正在研究贝叶斯世界。到目前为止,我已经了解MLEMPA点估计,因此使用此类模型仅输出一个特定值而不是分布。

此外,vanilla neural networks实际上做类似的事情MLE,因为最小化平方损失或交叉熵类似于找到最大化可能性的参数。此外,使用具有正则化的神经网络与 MAP 估计相当,因为先前的工作类似于误差函数中的惩罚项。

但是,我找到了这项工作这表明权重WPLS从惩罚最小二乘法中获得的权重与权重相同WMAP通过最大后验获得:

在此处输入图像描述

然而,论文说:

"前两种方法产生相似的预测,尽管 MAP 贝叶斯模型确实给出了t此分布的均值与经典预测器的均值相同y(x;WPLS), 自从WPLS=WMAP

我在这里没有得到的是 MAP 贝叶斯如何给出概率分布t,当它只是一个点估计?考虑一个神经网络——一个点估计意味着一些固定的权重,那么怎么会有一个输出概率分布呢?我认为这只能在真正的贝叶斯中实现,我们在其中整合未知权重,因此使用所有可能的权重构建类似于所有结果的平均权重的东西。

1个回答

贝叶斯 MAP 给出点估计 wMAP 对于模型参数 w,这意味着

p(w|t,)={1w=wMAP0o.w.

然而,分布 p(t|x,wMAP,σ2)目标的概率模型 t 给定输入 x和参数;在等式之后。(8)、论文明确表示x's 从目标可能性给定中省略p(t|.),但我认为它们应该保留在那里以避免混淆。提醒一下也可能会有所帮助(x,t)={(x1,t1),...,(xn,tn)} 是观察到的(输入,目标)对。

纸上说什么时候 wMAP 被计算,这将与 wPLS, 目标分布的均值将与确定性目标相同 t=y(x;wPLS)从惩罚最小二乘。那是,

E[t|x,wMAP,σ2]=tp(t|x,wMAP,σ2)dt=y(x;wPLS)

总之,在(惩罚)最小二乘中,目标和参数都是确定性的。在非贝叶斯和贝叶斯 MAP 中,参数是确定性的,但目标是概率性的。在(真)贝叶斯中,目标和参数都是概率性的。在完全贝叶斯中,超参数(参数分布的参数,例如α) 也是概率性的。