理查德·道金斯将罗纳德·费舍尔描述为“现代统计学和实验设计之父”,这句话在费舍尔的维基百科传记中被引用。Anders Hald在他的《数理统计史》一书中称他为“几乎单枪匹马地为现代统计科学奠定基础的天才” 。
我只是想知道他到底做了什么让人们对他给予如此高的评价?
理查德·道金斯将罗纳德·费舍尔描述为“现代统计学和实验设计之父”,这句话在费舍尔的维基百科传记中被引用。Anders Hald在他的《数理统计史》一书中称他为“几乎单枪匹马地为现代统计科学奠定基础的天才” 。
我只是想知道他到底做了什么让人们对他给予如此高的评价?
很难写出这个问题的答案
Ronald Fisher 的主要统计贡献是什么?
因为已经有许多关于这个主题的优秀作品,由优秀的作家创作,包括伟大的统计学家,例如:
这些作品很难在互联网问答板上用几行简单的文字来匹配。最重要的是,要掌握费舍尔的全部想法并不容易,正如埃夫隆在他关于费舍尔的著作中所写的那样:
评估费舍尔统计的重要性的一个困难是很难说它是什么。费舍尔有很多重要的想法,其中一些,比如随机推理和条件性,是相互矛盾的。这有点好像在经济学中,马克思、亚当·斯密和凯恩斯原来是同一个人。
Fisher 贡献的一个简单但非常好的来源是 Wikipedia。只需阅读有关统计历史的文章(或者您可以使用任何其他文本),您就会对费舍尔贡献的数量和重要性有所了解。
您还将看到,部分原因是时间、地点和运气使费舍尔成为了一个伟大的贡献者。费舍尔是 20 世纪初一位重要且有影响力的统计学家,当时应用统计学的基本基础已经建立,并且该领域相对较小(与 18 世纪和 19 世纪的数学时期相比)。
费舍尔上台时,第一个统计学杂志和大学第一个统计学系刚刚成立。在 20 世纪初之前,主要有回归的方法和一些关于残差和误差分布的想法,用于天文学等领域。
测量误差和结果概率的概念。这种类型的数学和逻辑(更接近于纯数学,并且......被认为更崇高,并且较少受到当时严肃的数学家的谴责),被更广泛地应用于费舍尔选择的领域:遗传学、进化论、生物学、农业. 由于出色的数学家费舍尔对这些早期发展做出了重大贡献(甚至可能被认为是这些发展的主要推动力),因此他的工作在统计学史上占有重要地位。
如果您查看统计介绍书中的主题(特别是数学概念或推理),您可能会认为 Fisher 是主要贡献者。也是费舍尔写了第一本,也是最有影响力的统计书籍导论:
请注意,这些书籍的在线版本存在SMRW 和部分 DE(参见 10 月 29 日的阅读资料)。
从 1912 年到 1925 年,费舍尔:
所以大致涵盖了当前介绍文本使用的大部分基本推理工具。在从事这项统计工作时,费舍尔解决了让理查德·道金斯这样的人非常钦佩他的遗传学中的主要问题。
费舍尔引入了许多概念和术语并改进了统计语言。这个问答网站上最近的两个问题与费舍尔有关。为什么这么多变量在统计中是平方的,为什么我们经常规范而不是. 是费舍尔“证明”了norm 是比范数(假设一个完美的高斯分布,Fisher 后来同意这对于“真实”错误并不总是正确的),并在这样做时引入了作为“有效统计量”和“充分统计量”的术语,并引入了术语“方差”(在他 1920 年的论文中通过平均误差和均方误差确定观察精度的方法的数学观察)。
在 1922年关于理论统计的数学基础的论文中,费舍尔对主要概念进行了简短的概述,仅列出定义列表:“位置中心”、“一致性”、“分布”、“效率”、“估计','内在准确性','等统计区域','可能性','位置','最佳','缩放','规格','充分性','有效性'。它需要历史学家来了解费舍尔在作为概念创始人的意义上在这里做出了什么贡献,这也与埃夫隆的陈述有关。很难掌握究竟是由谁贡献的。
在那篇文章中,Fisher 开始提到将“均值”和“方差”等术语应用于真实分布值和估计值的问题。
(我会尽量避免将费舍尔放在诸如常客或贝叶斯之类的“学校”中。我会说他对手头的任何问题都“足够”实用)。
在他的进一步工作中,Fisher 发展了线性判别分析的早期概念:
四次测量的线性函数是多少将最大化特定平均值与物种内标准偏差之间的差异的比率?
以及Fisher进一步探索的可能性估计概念,有两个以他的名字命名的概念,Fisher信息和Fisher score。参见统计估计理论,1925 年,数学似然的两个新属性,1934年和归纳推理的逻辑,1935 年。
他发明了一些概念:充足性、效率、方差分析、辅助性、p 值,可能还有许多其他概念(最重要的是实验设计)。
似然函数和mle有前身,但被他推广。
Ronald Aylmer Fisher爵士在实验设计和现代统计理论与实践的诸多方面享有盛誉。他最重要的贡献包括显着性检验(Bandyopadhyay 和 Cherry 2011)、最大似然估计(MLE)、置换(重新采样)分布、充分性、渐近最优性理论(Efron 1998)和实验设计组件,包括随机化、复制、阻塞、混杂和方差分析 (ANOVA)。同样值得注意的是他对孟德尔豌豆植物实验的论点。他声称这“好得令人难以置信”。
考虑阅读 Efron (1998) 的论文“21 世纪的 RA Fisher”。让我引用摘要:
费舍尔是 20 世纪统计数据中最重要的人物。本次演讲探讨了他对现代统计思维的影响,试图预测我们对 21 世纪的预期会是怎样的费舍尔式。费舍尔的哲学被描述为贝叶斯和常客观点之间的一系列精明妥协,并增加了一些在应用问题中特别有用的独特特征。研究了几个当前的研究主题,着眼于渔民的影响,或缺乏它,以及这预示着未来的统计发展。本文基于 1996 年费舍尔的演讲,紧跟该演讲的正文。
参考
Bandyopadhyay、Prasanta S. 和 Steve Cherry。“初等概率和统计:入门。” 统计哲学 7(2011):53。
埃夫隆,布拉德利。“ 21 世纪的 RA 费舍尔。” 统计科学(1998):95-114。