浏览有关最大后验估计的维基百科文章,阅读此内容后感到困惑:
它与最大似然 (ML) 估计方法密切相关,但采用了一种增强的优化目标,该目标在想要估计的数量上结合了先验分布(通过相关事件的先验知识量化可用的附加信息)。因此,MAP 估计可以看作是 ML 估计的正则化。
MAP 估计如何被视为 ML 估计的正则化?
编辑:
我对正则化的理解是在机器学习的背景下惩罚高权重。这是通过在包含要学习的权重的损失函数中添加一个术语来修改优化问题来完成的。并且目标是最小化损失,具有较高值的参数受到更多惩罚。
一个直观的解释是非常受欢迎的。