有一种模拟研究通常用于验证贝叶斯模型的实现:
- 对于独立复制:
- 从关节先验中绘制一组“真实”参数参数。
- 给定参数来自 (1) 的可能性,从可能性中绘制数据集。
- 近似完整的联合后验分布,例如使用 MCMC 或变分推理。
- 对于每个参数(索引) % 后验区间覆盖了 (1) 的先验预测抽取, = 1 。否则, = 0。
- 对于每个参数,计算覆盖率:。如果,则模型或软件存在问题。
这种技术在我团队的工作中非常有用,它已经发现了很多错误。有谁知道它有正式名称吗?我一直在寻找,但一直找不到。起初我以为它被称为“基于模拟的校准”,但我所描述的是上面的(4)而不是校准部分。
参考
Andrew Gelman、Aki Vehtari、Daniel Simpson、Charles C. Margossian、Bob Carpenter、Yuling Yao、Lauren Kennedy、Jonah Gabry、Paul-Christian Bürkner 和 Martin Modrák。(2020 年)。贝叶斯工作流程。https://arxiv.org/abs/2011.01808
Cook、Samantha R.、Andrew Gelman 和 Donald B. Rubin。2006.“使用后分位数验证贝叶斯模型的软件。” 计算和图形统计杂志 15 (3): 675–92。http://www.jstor.org/stable/27594203。
Talts、Sean、Michael Betancourt、Daniel Simpson、Aki Vehtari 和 Andrew Gelman。2020.“使用基于模拟的校准验证贝叶斯推理算法。” http://arxiv.org/abs/1804.06788。