假人费舍尔?

机器算法验证 参考 历史 基准 罗纳德-费舍尔
2022-03-22 19:40:21

简短版: 是否有针对罗纳德·费舍尔(Ronald Fisher)关于统计学的著作(论文和书籍)的介绍,这些著作是针对那些很少或没有统计学背景的人的? 我正在考虑针对非统计学家的“带注释的费舍尔阅读器”之类的东西。

我在下面详细说明了这个问题的动机,但请注意它是冗长的(我不知道如何更简洁地解释它),而且它几乎肯定会引起争议,可能很烦人,甚至可能会令人愤怒。所以请跳过这篇文章的其余部分,除非你真的认为这个问题(如上面给出的)太简洁而无法在没有进一步澄清的情况下回答。


我已经自学了许多人认为困难的许多领域的基础知识(例如线性代数、抽象代数、实数和复数分析、一般拓扑、测度论等)但是我自学统计学的所有努力都失败了.

这样做的原因不是我发现统计数据在技术上很困难(或者比我设法通过的其他领域更困难),而是我发现统计数据一直是陌生的,如果不是完全奇怪的话,远比任何我自学的其他领域。

慢慢地,我开始怀疑这种怪异的根源主要是历史,而且作为一个从书本中学习这个领域的人,而不是从实践者社区(如果我接受过统计学方面的正式培训,情况就会如此) ),除非我更多地了解统计学的历史,否则我永远无法摆脱这种疏离感。

所以我读过几本关于统计学史的书,事实上,这样做在解释我认为该领域的怪异方面已经走了很长一段路。但是我仍然有一些方法可以朝这个方向发展。

我从阅读统计学史中学到的一件事是,我认为统计学中许多奇怪的事情的根源是一个人,罗纳德·费舍尔。

事实上,下面的引用1(我最近才发现)与我的认识非常一致,即只有深入研究一些历史,我才能开始理解这个领域,以及我将 Fisher 作为我的参考点:

大多数统计概念和理论可以与它们的历史渊源分开描述。对于“基准概率”的情况,如果没有不必要的神秘,这是不可行的。

事实上,我认为我在这里的预感,虽然是主观的(当然),但并非完全没有根据。费舍尔不仅贡献了一些统计学中最具开创性的想法,而且因无视以前的工作和依赖直觉而臭名昭著(要么提供其他人几乎无法理解的证据,要么完全忽略它们)。此外,他与 20 世纪上半叶的许多其他重要统计学家有着终生的争执,这些争执似乎在该领域播下了许多混乱和误解。

我从这一切得出的结论是,是的,费舍尔对现代统计学的贡献确实是深远的,尽管并非所有这些都是积极的。

我还得出结论,要真正了解我对统计的疏离感,我至少必须阅读费舍尔的一些原始作品。

但我发现费舍尔的作品不辜负其难以理解的名声。我试图找到这些文献的指南,但不幸的是,我发现的所有内容都是为受过统计学培训的人设计的,所以我很难理解它声称要阐明的内容。

因此,本文开头的问题。


1 Stone, Mervyn (1983),“基准概率”,统计科学百科全书 3 81-86。威利,纽约。

2个回答

带注释的 Fisher 将是一个极好的资源!

我认为,如果不同时尝试了解统计发展的其他主要部分以及费舍尔与其他重要贡献者的互动,您将无法理解费舍尔。我发现Michael Cowles的《心理学统计:历史视角》非常有帮助。(不要让书名的心理作用让你失望:这本书很笼统,似乎是一个非常公平的描述。)

关于注释费舍尔的话题,我最近在他的一段话中注释当我被要求证明费舍尔提出 P 值作为反对零假设的证据指标的断言时。我是这样回答的:

我环顾四周没有找到确切的说明,因为像往常一样,费舍尔的写作很笨拙,需要读者做出一些努力的解释。他在 p 上说。统计方法和科学推理的46(我有最后一版):

“虽然可以识别为不情愿或拒绝接受命题的心理状况,但由重要性测试引起的感觉有一个客观基础,因为它所基于的概率陈述是一个事实,可以通过以下方式传达和验证, 其他理性的头脑。在这种情况下的重要性水平满足了衡量它所产生的怀疑的理性根据的条件。它比任何关于命题的精确概率陈述更原始或基本,并且不能证明它是正当的。 "

这又是我的编辑和解释性陈述:

其对显着性检验原则的误解或误用在前一段中受到费舍尔的批评。]。这种情况下的显着性水平 [P 值] 满足了衡量其产生的怀疑的合理理由的条件 [也就是说,证据]。它比任何关于命题的确切概率陈述更原始或基本,并且不能证明[因此可以是一个索引,但不是概率的度量。]。”

优秀的网页在

http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/rafreader.htm

有非常完整的参考书目。