理解 Behrens-Fisher 问题

机器算法验证 推理 基准
2022-03-17 18:02:18

本文这一部分说:

Ronald Fisher 在 1935 年引入了基准推理,以便将其应用于这个问题。他提到了 WV Behrens 在 1929 年发表的一篇较早的论文。Behrens 和 Fisher 提出要找到 的概率分布 其中是两个样本均值,是它们的标准差。[ . . . ] Fisher 通过忽略标准偏差的相对大小的随机变化来近似此分布,

Tx¯1x¯2s12/n1+s22/n2
x¯1x¯2s1s2
s1/n1s12/n1+s22/n2.

我发现我不愿意相信这一点。(因此,维基百科是错误的!)在接下来的几周内,我将阅读费舍尔、贝伦斯和巴特利特在 1930 年代写的关于此的内容。现在,我正在看 Fisher 的书Statistical Methods and Scientific Inference和埃德温·杰恩斯一样,我的印象是,他偶尔是个白痴这一事实并不能改变他是一个伟大天才的事实,但他并不总是以最适合与人交流的方式表达自己小凡人。在第 97 页,费舍尔写道巴特利特:

[...]参考集 [...] 并不仅限于观察到的具有比率的子集,而是被 MS Bartlett 急切地抓住了,好像它是复合假设,即在特殊情况下,拒绝的标准比其他情况下更不容易偶然获得。经过反思,我认为人们不应期待其他任何事情,[...]s1/s2

因此,在我看来,Fisher 并不打算“忽略”比率的“随机变化”作为一种近似方法,而是他认为应该以为条件。这看起来确实像“以辅助统计为条件”,费舍尔在其他情况下如此成功地使用了它。s1/s2s1/s2

如果我没记错的话,当我在统计科学百科全书中读到这一点时,我第一次听说了 Bartlett ,它简单地说,Bartlett 是第一个表明基准区间与置信区间不同的人,通过显示基准区间费舍尔在这个问题中得出的结论没有恒定的覆盖率。该声明并没有给我留下对此存在争议的印象。

所以这是我的问题:哪个更接近真相:维基百科的文章还是我的怀疑?

  • Fisher, RA (1935) “统计推断中的基准论点”,《优生学年鉴》,第 8 页,第 391-398 页。
1个回答

我之前可能在网站上提到过一次。我将尝试找到我讨论过的帖子的链接。1977 年左右,当我还是斯坦福大学的一名研究生时,我参加了一个费舍尔研讨会。斯坦福大学的许多教授和访客都参加了,包括布拉德·埃夫隆和访客西摩·盖瑟和大卫·欣克利。吉米萨维奇当时刚刚在统计年鉴上发表了一篇题为“重读 RA 费舍尔”的文章。由于您对 Fisher 非常感兴趣,我建议您查找并阅读本文。

受这篇论文的启发,这次研讨会旨在重读费舍尔的许多著名论文。我的任务是关于 Behrens-Fisher 问题的文章。我的感觉是,费舍尔虚荣而固执,但从不愚蠢。他有很强的几何直觉,有时难以与他人交流。他与 Gosset 有着非常友好的关系,但与 Karl Pearson(最大似然与矩量法)以及 Neyman 和 Egon Pearson(通过基准推理的显着性检验与假设检验的 Neyman-Pearson 方法)存在严重分歧。尽管基准论点通常被认为是费舍尔的唯一大缺陷并且已经名誉扫地,但这种方法并没有完全死掉,近年来又有了新的研究。

我认为基准推理是费舍尔试图成为“客观贝叶斯”的方式。我相信他对统计基础进行了长期而认真的思考。他不接受贝叶斯方法,但也不认为基于考虑你没有绘制的可能样本的推理的想法是有意义的。他认为推断应该仅基于手头的数据。这个想法很像贝叶斯推理,因为贝叶斯推理基于数据(似然性)和参数(先验分布)进行推理。在我看来,费舍尔的想法很像杰弗里斯,只是他希望推理基于可能性,并希望完全放弃先验。这就是导致基准推理的原因。

野蛮人文章的链接

费舍尔的女儿琼·费舍尔的传记

RA Fisher An 感谢,欣克利和范伯格编辑

埃里希·莱曼 (Erich Lehmann) 写的一本关于费舍尔和内曼以及古典统计学诞生的书

这是我之前评论过的一篇你也发布过的帖子的链接。贝伦斯-费雪问题

总之,我认为我需要解决您的简短问题。如果您引用的陈述“Fisher 通过忽略标准偏差的相对大小的随机变化来近似分布”是您所指的,我认为这是完全错误的。费舍尔从不忽视变异。我重申,我认为基准论点的基础是观察数据和似然函数应该是推断的基础,而不是您可以从总体分布中获得的其他样本。所以我会在这个问题上支持你。关于巴特利特,我记得这么多年前我对这件事的研究,他们也对此进行过激烈的辩论,巴特利特提出了一个很好的理由,并在辩论中坚持了自己的观点。