我们常客真的只是隐含/不知情的贝叶斯主义者吗?

机器算法验证 贝叶斯 推理 可能性 似然比 常客
2022-01-21 14:46:59

对于给定的推理问题,我们知道贝叶斯方法通常在形式和结果上都不同于 fequentist 方法。常客(通常包括我)经常指出他们的方法不需要先验,因此更多的是“数据驱动”而不是“判断驱动”。当然,贝叶斯可以指向无信息的先验,或者,为了务实,只使用真正分散的先验。

我担心,尤其是在对我的经验主义客观性感到一丝沾沾自喜之后,我的所谓“客观”方法可能可以在贝叶斯框架中制定,尽管有一些不寻常的先验和数据模型。在那种情况下,我是否只是对我的常客方法所暗示的荒谬的先验和模型一无所知?

如果贝叶斯主义者指出这样的表述,我想我的第一反应会是“嗯,你能做到这一点很好,但我不是这么想的!”。然而,谁在乎我是怎么的,或者我是如何制定它的。如果我的程序在统计/数学上等同于某个贝叶斯模型,那么我隐含地(不知不觉!)执行贝叶斯推理。

下面的实际问题

这种认识大大削弱了任何自鸣得意的诱惑。但是,我不确定贝叶斯范式是否可以适应所有常客程序(同样,前提是贝叶斯选择合适的先验和可能性)我知道反过来假的。

我问这个是因为我最近发布了一个关于条件推理的问题,这导致我写了以下论文:here(见 3.9.5,3.9.6)

他们指出了 Basu 的著名结果,即可能存在不止一个辅助统计数据,从而提出了哪个“相关子集”相关的问题。更糟糕的是,它们展示了两个例子,即使你有一个独特的辅助统计数据,它也不会消除其他相关子集的存在。

他们继续得出结论,只有贝叶斯方法(或与其等效的方法)才能避免这个问题,从而允许毫无问题的条件推理。


贝叶斯统计可能并非如此Fequentist Stats——这是我在这里向这个小组提出的问题。但似乎这两种范式之间的基本选择与其说是哲学,不如说是目标:你需要高条件准确性还是低无条件错误:

  • 当我们必须分析单个实例时,高条件精度似乎是适用的——我们希望正确地进行这个特定的推理,尽管这种方法可能不适合或不准确用于下一个数据集(超条件/专业化)。

  • 如果我们愿意在某些情况下做出有条件的不正确推断,那么低无条件错误是合适的,只要我们的长期错误被最小化或控制。老实说,在写完这篇文章之后,我不确定为什么我会想要这个,除非我时间紧迫并且无法进行贝叶斯分析......嗯。

我倾向于支持基于似然的 Fequentist 推理,因为我从似然函数中获得了一些(渐近/近似)条件,但不需要摆弄先验 - 但是,我对贝叶斯推理越来越熟悉,尤其是如果我看到了小样本推断的先前 aa正则化项。

对不起旁边。对我的主要问题的任何帮助表示赞赏。

2个回答

贝叶斯学派和频率学派不仅在他们如何获得推论上不同,或者这些推论的相似或不同程度可能不确定某些先验选择。主要区别在于他们如何解释概率:

贝叶斯概率

贝叶斯概率是对概率概念的一种解释。与将概率解释为某种现象的频率或倾向相反,贝叶斯概率是一个用于表示知识状态或信念状态的量。

频率概率

频率论概率或频率论是概率的标准解释;它将事件的概率定义为在大量试验中其相对频率的极限。这种解释支持实验科学家和民意调查者的统计需求;概率可以(原则上)通过可重复的客观过程找到(因此理想情况下没有意见)。它不支持所有需求;赌徒通常需要在没有实验的情况下估计赔率。

这两个定义代表了定义概率概念的两种不可调和的方法(至少到目前为止)。因此,这两个领域之间存在更多根本差异,而不是您是否可以在某些参数或非参数模型中获得相似的估计量或相同的结论。

我认为频率论者确实经常是“隐含/不知情的贝叶斯主义者”,因为在实践中,我们经常希望对没有长期频率的事物进行概率推理。经典的例子是零假设统计检验 (NHST),我们真正想知道的是零假设和研究假设为真的相对概率,但我们不能在频率论设置中这样做,因为特定假设的真实性没有(非平凡的)长期运行频率 - 要么是真的,要么不是。频繁的 NHST 通过替换一个不同的问题来解决这个问题,“在零假设下观察结果至少为极端的概率是多少”,然后将其与预先确定的阈值进行比较。然而这个程序在逻辑上不允许我们得出关于 H0 或 H1 是否正确的任何结论,并且在这样做时,我们实际上是在走出频率论框架进入(通常是主观的)贝叶斯框架,我们得出结论,在 H0 下观察到这样一个极值的概率是如此之低,以至于我们不再相信 H0 可能是真的(注意这是隐含地将概率分配给特定假设)。

请注意,常客程序实际上没有主观性或先验性,这实际上不是真的,在 NHST 中,p 值的阈值,α, 与先验的目的大致相同p(H0)p(H1)在贝叶斯分析中。备受讨论的 XKCD 动画片说明了这一点:

在此处输入图像描述

频率论者的结论不合理的主要原因是α并不代表关于探测器和/或太阳物理学的合理知识状态(我们知道太阳爆炸的可能性极小,更不用说探测器有误报)。请注意,在这种情况下,太阳爆炸的结论是从低 p 值(贝叶斯推论)推断出来的,但它在逻辑上并不必然。主观性仍然存在,但在分析中没有明确说明,经常被忽视。

可以说置信区间经常被使用(并解释为)一个区间,在该区间中,我们可以期望以给定的概率看到观察结果,这也是贝叶斯解释。

理想情况下,统计学家应该意识到这两种方法的优缺点,并准备好为手头的应用程序使用正确的框架。基本上,我们的目标应该是使用对我们真正想要回答的问题提供最直接答案的分析(而不是悄悄地替换一个不同的答案),因此在我们实际上对长期频率感兴趣的情况下,频率论方法可能是最有效的情况并非如此的贝叶斯方法。

我怀疑最常见的问题可以由贝叶斯人回答,因为没有什么可以阻止贝叶斯人回答诸如“观察到一个结果的概率是多少,至少是极端的,如果H0是真的”,但是我需要对那个有趣的问题做一些阅读。