我搜索了很多文献,但未能找到两者之间的确切区别。我的印象是,在机器学习文献中你会发现分层贝叶斯建模的典故,但在统计学文献中你很少会发现 PGM 的典故。希望你们能消除我的困惑。我有一些具体的问题,但很乐意让有经验的人向我解释他们的直觉。(我即将开始认真研究这些东西,这就像在我的大脑中“铺平道路”,或者类似的东西。)
- 由于分层贝叶斯模型也是有向无环图,你能在这种情况下使用 PGM(连接树等)的消息传递算法吗?
- 贝叶斯网络通常将随机变量表示为条件概率表,可以通过计数来填写(最大似然)。将分层贝叶斯视为该想法的某种计算上更灵活的版本是否正确,您可以使用可以查询的数学函数(参数概率分布)代替 CPT?
- 在这种情况下,超参数/超先验的作用是什么?您的推理过程是否关注在观察数据后推断超参数,然后设置这些参数以统计有用的方式向下传播层次结构?(这听起来就像每次你抽象出层次结构中的一个节点与父节点时,你都会创建一种聚类模型)。
任何描述这两个概念的文献将不胜感激。非常感谢!