浏览了互联网和论文后,我发现 Backprop 的 Bayes 非常难以理解,因为我对变分推理的中级理解。
大多数在线指南也缺乏这样的解释:Weight Uncertainty in Neural Networks解释了整个 ELBO 的想法,但没有详细说明为什么它不仅仅是一个变分自动编码器。
变分自编码器和 Bayes By Backprop 类型的神经网络有什么区别?它只是有效地“编码”了 VAE 但对 y 回归了吗?如果是这样,那与混合密度类型的神经网络有什么不同?
我可以查看代码,但我的方法是分别理解它们,以便我可以对实现保持批判性 - 每个人都可以发布任何代码,因此有理由批评。