在常客“学派”中,信念是如何更新的?

机器算法验证 假设检验 贝叶斯 常客 哲学的
2022-01-31 20:47:46

背景

编辑:我意识到我对“假设”这个词的使用令人困惑,我并不是说特别是零假设。我的意思是一个关于某事是真实的命题。

根据我有限的理解,贝叶斯概率代表信念。因此,科学家可以在进行实验或研究之前为假设为真的陈述分配一个信念/概率,然后当研究结果可用时,通过正式的数学推理将更新的信念计算为数值(概率)。

从频率论者的观点来看,概率不是信念。然而,通常会发现类似于“我们的研究加强了 H 是真的证据”这样的短语。鉴于一项研究已经产生了为假设提供“支持证据”的结果,因此常客对这个假设有“更强烈的信念”似乎是合理的。不管先验信念和后验信念是否用数字表示(但不是概率),它们之间无疑似乎应该有一个顺序,例如“研究后的信念”>“研究前的信念”。但是,与研究之前相比,这种信念的更新究竟是如何发生的,或者如何传达一个人在研究之后相信一个假设是正确的程度,这对我来说还不清楚。的确,


问题:在常客学派中,是否有更新信念的正式/数学程序?


如果没有这样的程序,似乎很难理解科学家说一项研究加强了某事是真实的证据,超越了“大于”和“小于”的观点。从先前和新数据到信念的映射似乎更加不透明与贝叶斯相比,从常客的角度来看,对我来说。当然,贝叶斯有主观的先验,但考虑到这些先验,数据和选择的分析似乎非常清楚信念是如何通过贝叶斯规则更新的(尽管我知道常客也可以使用贝叶斯规则,只是不适用于信念)。另一方面,我几乎不认为使用贝叶斯方法的人一定会真正让获得的后验概率代表他们对某事的确切信念,因为在给定的分析中可能有很多怀疑、不同意或改进的地方。我不想在“贝叶斯与频率论者”之间灌输任何辩论,我太无知了,无法发表意见。希望这个问题不是荒谬的,在这种情况下我道歉。

3个回答

如果您用数字连贯地表示信念,那么根据定义,您就是贝叶斯。至少有 46656 种不同类型的贝叶斯(在这里统计:http://fitelson.org/probability/good_bayes.pdf ,但“定量更新信念”是将它们结合在一起的一件事;如果你这样做,你就在贝叶斯俱乐部。另外,如果要更新信念,则必须使用贝叶斯规则进行更新;否则你会语无伦次并被荷兰人预订。有点有趣的是,通往规范理性的一条真正途径仍然承认这么多品种。

尽管贝叶斯主义者垄断了“信念”(根据定义),但他们并没有垄断“证据的强度”。还有其他方法可以量化它,激发示例中给出的那种语言。Deborah Mayo 在“作为严格测试的统计推断”中详细介绍了这一点。她的首选选项是“严重性”。在严重性框架中,您永远不会量化您的信念,但是您确实会说“此声明已经过严格测试”或“此声明尚未经过严格测试”,并且您可以通过随着时间的推移应用多个测试来逐步增加严重性. 这肯定感觉很像加强信念。你只是不能用那个确切的词来描述它(因为贝叶斯主义者现在拥有“信仰”这个词)。这确实是另一回事,因此最好避免可能的术语冲突:从高严重性中获得的是良好的错误控制率,而不是“真实(错误)信念”。它的行为很像相信它可以持续更新的方式!对不称其为“信念”的挑剔纯粹是基于不处理知识状态的(重要)技术性,将其与贝叶斯主义者所做的事情区分开来。

Mayo 在https://errorstatistics.com/上撰写并链接到更多关于此的内容。 听起来您可能会喜欢 Aubrey Clayton 的“Bernoulli's Fallacy”:它很容易理解,但确实切入了这个问题的根源。在此处以播客形式讨论https://www.learnbayesstats.com/episode/51-bernoullis-fallacy-crisis-modern-science-aubrey-clayton

免责声明:我有贝叶斯偏差。

常客假设检验的目的是拒绝原假设:这证明备择假设不同。这样的实验不会给你“证据表明H是真的”,即使你能听到人们这样说。p-value 是观察数据的概率D比观察到的更极端,因为假设H是真的P(D>d|H).

贝叶斯后验概率是相反的,即H给定数据为真P(H|D)=P(D|H)P(H)/P(D). 所以事实上在贝叶斯设置中,你确实更新了你的先前信念P(H)关于H给定观察到的数据,而在常客环境中你没有。频率论实验并不能告诉你可能性有多大H是的,正因为如此,它并没有给你一个直接的框架来更新你对它的信念。如果你拒绝了假设H=5,它仍然可以是任何东西(只是不是5),你仍然不知道它是什么。

也存在最大似然,“找到H使得观察的可能性D在它之下是最高的”,但同样,它并没有告诉你什么P(H|D)是。

最后,如果您将概率视为信念的衡量标准,那么您已经站在了贝叶斯一边。由于采用了这样的观点,您可以衡量给定数据的真实程度。在常客环境中,您只能做出“假设它是真实的”声明。

不,没有常客遵循的正式方法来更新他们的信念。我对为什么会这样的非常简短的解释如下,并且只关注频率测试方法。我们可以将假设检验视为解决问题:给定假设的概率模型,数据(统计上)是否与原假设一致?举一个具体的例子,假设有人声称阿司匹林可以减少痤疮。一群科学家决定检验这一说法,并进行了一项精心设计的大型实验。零假设是阿司匹林不会减少痤疮。观察到 p 值为 0.3,并且不拒绝原假设。科学家们在实验之前或之后可能对零假设有看法(更不用说“信念”),也可能没有,但谁在乎他们是否这样做?重要的是实验产生的证据。科学通过测试共识来进步,直到出现足够的证据来改变共识。