哈密​​顿蒙特卡罗和离散参数空间

机器算法验证 贝叶斯 马尔可夫链蒙特卡罗 离散数据 斯坦
2022-02-26 18:56:35

我刚刚开始在stan中构建模型;为了熟悉该工具,我正在完成贝叶斯数据分析(第 2 版)中的一些练习。Waterbuck练习假设数据,其中未知。由于 Hamiltonian Monte Carlo 不允许离散参数,因此我将声明为实数并使用该函数编码实值二项式分布。nbinomial(N,θ)(N,θ)N[72,)lbeta

结果的直方图看起来与我通过直接计算后验密度发现的几乎相同。但是,我担心可能有一些微妙的原因我不应该相信这些结果。由于对的实值推断将正概率分配给非整数值,因此我们知道这些值是不可能的,因为在现实中不存在分数水巴克。另一方面,结果似乎很好,因此在这种情况下,简化似乎对推理没有影响。N

以这种方式建模是否有任何指导原则或经验法则,或者这种将离散参数“提升”为真正不好的做法的方法?

1个回答

首先,请随时在我们的用户列表(http://mc-stan.org/mailing-lists.html)上提出这样的问题,我们不仅讨论与 Stan 实现/优化/等相关的问题,还讨论实用的统计和建模问题。

至于你的问题,这绝对是一个好方法。有很多方法可以更严格地证明它的合理性(例如,查看离散 CDF 与其连续近似之间的差异)但基本上只要您的方差大于几倍统一,那么缺失的离散化就不会真正有任何对后续推论的影响。

这种近似无处不在,一个常见的例子是将多项分布近似为独立泊松分布的乘积,然后将其近似为高斯分布。