为什么不允许贝叶斯查看残差?

机器算法验证 贝叶斯 残差 常客 似然原理
2022-01-17 07:54:13

在文章“讨论:生态学家应该成为贝叶斯主义者吗?” 布赖恩·丹尼斯(Brian Dennis)对贝叶斯统计给出了令人惊讶的平衡和积极的看法,而他的目的似乎是警告人们。然而,在一段中,没有任何引用或理由,他说:

贝叶斯,你看,不允许查看他们的残差。根据模型下结果的极端程度来判断结果违反了似然原则。对于贝叶斯主义者来说,没有不好的模型,只有不好的信念。

为什么不允许贝叶斯算法查看残差?什么是合适的引用(即他引用谁)?

Dennis, B.
讨论:生态学家应该成为贝叶斯主义者吗?生态应用,
美国生态学会1996,6,1095-1103

2个回答

他们可以看,但不能触摸。毕竟,残差是数据中不包含任何模型参数信息的部分,它们的先验表达了关于这些参数的所有不确定性——它们不能根据他们在数据中看到的内容来改变它们的先验。

例如,假设您正在拟合高斯模型,但注意到残差中的峰度过高。也许您先前的假设应该是在低自由度上具有非零概率的 t 分布,但事实并非如此——它实际上是在任何地方都具有零概率的 t 分布,除了无限自由度。在先验密度为零的后验密度区域上,任何可能性都不会导致非零概率。因此,当原始先验被错误指定时,根据数据的可能性不断更新先验的概念就不起作用了。

当然,如果你谷歌“贝叶斯模型检查”,你会发现这是对实际贝叶斯实践的模仿;尽管如此,对于贝叶斯主义在哲学基础上的优越性的科学逻辑类型的论证来说,它确实代表了某种困难。Andrew Gelman 的博客对这个话题很感兴趣。

当然贝叶斯可以看残差!当然,贝叶斯分析中也有不好的模型。也许 70 年代的一些贝叶斯主义者支持这样的观点(我对此表示怀疑),但如今你几乎找不到任何贝叶斯主义者支持这种观点。

我没有阅读文本,但贝叶斯主义者使用贝叶斯因子之类的东西来比较模型。实际上,贝叶斯甚至可以计算模型为真的概率并选择更可能为真的模型。或者贝叶斯可以跨模型进行平均,以获得更好的模型。或者可以使用后验预测检查。有很多选项可以检查模型,并且每个选项都可能偏爱一种或另一种方法,但是说贝叶斯分析中没有坏模型是无稽之谈。

因此,至多说,在某些极端版本的贝叶斯主义(顺便说一句,几乎没有人在应用设置中使用的极端版本​​)中,您不允许检查您的模型更为合适。但是你可以说,在某些极端版本的频率论中,你也不允许使用观测数据。但是,为什么要浪费时间讨论这些愚蠢的事情,当我们可以讨论在应用环境中是否以及何时应该使用贝叶斯或频率论方法或其他方法时?以我的拙见,这才是重要的。

更新: OP 要求提供支持极端版本贝叶斯的人的参考资料。由于我从未读过任何极端版本的贝叶斯,我无法提供此参考。但我想 Savage 可能是这样的参考。我从来没有读过他写的任何东西,所以我可能是错的。

ps.:想想“校准良好的贝叶斯”的问题(Dawid (1982), JASA , 77 , 379)。一个连贯的主观贝叶斯预测者不能未经校准,因此即使有压倒性的证据表明他未经校准,也不会审查他的模型/预测。但我认为没有人在实践中可以声称是连贯的。因此,模型审查很重要。

ps2.:我也喜欢Efron的这篇论文。完整的参考资料是:Efron, Bradley (2005)。“贝叶斯主义者、常客和科学家。” 美国统计协会杂志 100(469)。