像贝叶斯一样思考,像常客一样检查:这是什么意思?

机器算法验证 贝叶斯 数据挖掘 常客
2022-02-09 20:37:03

我正在看一些关于数据科学课程的演讲幻灯片,可以在这里找到:

https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf

不幸的是,我看不到本次讲座的视频,并且在幻灯片的某一点上,演示者有以下文字:

一些关键原则

像贝叶斯一样思考,像常客一样检查(和解)

有谁知道这实际上意味着什么?我有一种感觉,可以从中收集到关于这两种思想流派的很好的见解。

4个回答

贝叶斯统计学派和常客统计学派之间的主要区别在于概率解释的不同。贝叶斯概率是关于个人相信事件将会(或已经)发生的陈述。频率论概率是关于随着这些事件的数量增加而在极限内发生的类似事件的比例的陈述。

对我来说,“像贝叶斯一样思考”意味着随着新信息的出现更新您的个人信念,“像常客一样检查[或担心]”意味着关注统计程序在使用这些程序的时间汇总的性能,例如,可信区间的覆盖范围是多少,I/II 类错误率是多少等。

贝叶斯统计总结了信念,而常客统计总结了证据。贝叶斯主义者将概率视为一种相信程度。这种包容性和生成性的推理类型对于提出假设很有用。例如,贝叶斯主义者可能能够任意为月球是由绿色奶酪制成的概念分配一些概率,而不管宇航员是否真的能够前往那里验证这一点。这一假设也许得到了这样一种观点的支持:从远处看,月亮看起来像绿色奶酪。频率论者不能单独构想出一个不只是稻草人的假设,他们也不能说证据支持一个假设而不是另一个假设。即使是最大似然也只会产生一个“与观察到的最一致”的统计数据。形式上,贝叶斯统计允许我们跳出框框思考并从数据中提出合理的想法。但这是严格意义上的假设生成。

频率统计最适合用于确认假设。当实验进行得很好时,常客统计通过避开先验为发现提供“独立观察者”或“经验”背景。这与卡尔·波普尔的科学哲学是一致的。证据的重点不是要宣扬某个想法。大量证据与错误假设一致。证据只能伪造信念。

先验的影响通常被认为是统计推理中的偏差。如您所知,我们可以为事情发生的原因编造出许多原因。从心理上讲,许多人认为我们的观察者偏见是我们大脑中先验的结果,这些先验使我们无法真正衡量我们所看到的。“望云观察”正如圣母在沙丘中所说。波普尔使这个想法变得严谨。

这在我们这个时代一些最伟大的科学实验中具有重要的历史意义。例如,约翰·斯诺(John Snow)精心收集霍乱流行的证据,并敏锐地得出霍乱不是由道德剥夺引起的结论,并指出该证据与污水污染高度一致:注意他没有得出结论对此,Snow 的发现早于细菌的发现,并且没有机制或病因学的理解。在《物种起源》中也有类似的论述。直到宇航员真正降落在月球表面并收集样本之前,我们才真正知道月球是否是由绿色奶酪制成的。在这一点上,贝叶斯后验为任何其他可能性分配了非常、非常低的概率,频率论者充其量只能说样本与除月球尘埃之外的任何东西都高度不一致。

总之,贝叶斯统计适用于假设生成,而常客统计适用于假设确认。确保在这些工作中独立收集数据是现代统计学家面临的最大挑战之一。

PerCliff AB对 OP 的评论,听起来他们正在走向经验贝叶斯哲学。存在三种主要的贝叶斯学派,经验贝叶斯从数据中估计先验,通常使用频率论方法。这不完全符合引用(这意味着前面的贝叶斯,后面的常客一样的担忧),但我们不应该忽视Cliff AB的优秀评论。

此外,贝叶斯学派曾经并且可能仍然存在,认为在贝叶斯程序之后您不必检查任何内容。更现代的思想会使用后验预测检查,也许这种双重检查你的答案的方法就是引用所指的。

此外,常客哲学关注的是程序,而不是数据的推论。所以也许这也是引述含义的线索。

在这门数据科学课程的背景下,我对“像常客一样检查”的解释是,您评估预测函数或决策函数在保留的验证数据上的性能。“像贝叶斯一样思考”的建议表达了这样一种观点,即从贝叶斯方法派生的预测函数通常会产生良好的结果。