我正在阅读腾讯在线贝叶斯深度学习生产中关于贝叶斯深度学习的文章。它提到我们可以近似分布pt(w∣x)pt(w∣x)通过简单的分布qt(t)qt(t). 然后它提到这个分布可以是一个分解的高斯分布。
什么是分解高斯分布?
在这种情况下,因式分解意味着每个边际分布都是独立的。这里分解的高斯分布仅仅意味着协方差矩阵是对角的。