RA Fisher 的最新贡献之一是基准区间和基准原则论证。然而,这种方法远没有频率论或贝叶斯原则论点那么受欢迎。什么是基准论点,为什么不被接受?
什么是基准论点,为什么它没有被接受?
我很惊讶你不认为我们是权威。这是一个很好的参考:生物统计学百科全书,第 2 卷,第 1526 页;文章标题为“费舍尔,罗纳德·艾尔默”。从页面第一栏的底部开始,到第二栏的大部分内容,作者 Joan Fisher Box(RA Fisher 的女儿)和 AWF Edwards 写道
费舍尔在 1930 年提出了基准论点 [11].... 立即引起了争议。费舍尔提出了基准论证作为反概率的贝叶斯论证的替代方案,当无法说明客观的先验概率时,他谴责了该论证。
他们继续与 Jeffreys 和 Neyman 讨论辩论(尤其是 Neyman 关于置信区间)。假设检验和置信区间的 Neyman-Pearson 理论于 1930 年代在费舍尔的文章之后出现。紧接着是一句关键的话。
由于关键点的非唯一性,后来在多元估计的情况下出现了基准论点的困难。
在生物统计学百科全书的同一卷中,有一篇文章 pp. 1510-1515,由 Teddy Seidenfeld 题为“Fiducial Probability”,详细介绍了该方法并将基准区间与置信区间进行了比较。引用那篇文章的最后一段,
在 1963 年关于基准概率的会议上,萨维奇写道:“基准概率的目标……似乎就是我所说的在不破坏贝叶斯鸡蛋的情况下制作贝叶斯煎蛋卷。” 从这个意义上说,基准概率是不可能的。与许多伟大的智力贡献一样,具有持久价值的是我们试图理解费舍尔关于基准概率的见解。(有关此主题的更多信息,请参见 Edwards[4]。)例如,他对 Behrens-Fisher 问题的解决方案是使用贝叶斯定理对有害参数的出色处理。从这个意义上说,“……基准论点是‘向费舍尔学习’[36, p.926]。这样解释,它当然仍然是对统计知识的有价值的补充。
我认为爱德华兹在最后几句话中试图对费舍尔提出有利的看法,尽管他的理论已被质疑。我相信您可以通过这些百科全书论文和其他统计论文中的类似论文以及有关费舍尔的传记文章和书籍找到大量相关信息。
其他一些参考资料
Box, J. Fisher (1978)。“TA Fisher:科学家的生活。” Wiley, New York Fisher, RA (1930) 逆概率。剑桥哲学学会论文集。26, 528-535。
Bennett,JH 编辑(1990 年)统计推断和分析:RA Fisher 的选定通信。克拉伦登出版社,牛津。
爱德华兹,AWF (1995)。基准推理和自然选择的基本定理。生物识别 51,799-809。
Savage LJ (1963) 讨论。国际统计研究所公报 40, 925-927。
Seidenfeld, T. (1979)。“统计推断的哲学问题” Reidel, Dordrecht。Seidenfeld, T. (1992)。RA Fisher 的基准论证和贝叶斯定理。统计科学 7, 358-368。
图基,JW(1957)。一些具有基准相关性的示例。数理统计年鉴 28, 687-695。
扎贝尔,SL (1992)。RA Fisher 和基准论点。统计科学 7, 369-387。
这个概念很难理解,因为正如塞登菲尔德在《生物统计学百科全书》中的文章中所说,费舍尔一直在改变它
在 1930 年出版之后,在他生命的剩余 32 年中,通过两本书和大量文章,费舍尔坚定地坚持 (1) 中的观点,以及导致它的推理,我们可以称之为“基准逆推”难怪费舍尔的新奇想法引起了如此多的困惑
Seidenfeld 所指的方程 (1) 是给定为的基准分布,其中表示一个参数为 \theta 的随机变量X处单参数累积分布函数。至少这是费舍尔最初的定义。后来它扩展到多个参数,这就是Behrens-Fisher 问题中因此,给定观察数据,基准分布就像参数. 上的先验分布。
我在获得所有这些方面遇到了一些麻烦,但并不难找到。我们真的不需要回答这样的问题。使用关键词“基准推理”进行谷歌搜索可能会显示我发现的所有内容以及更多内容。
我进行了谷歌搜索,发现 UNC 教授 Jan Hannig 已经概括了基准推理以试图改进它。谷歌搜索产生了他最近的一些论文和一个 powerpoint 演示文稿。我将复制并粘贴下面他的演示文稿中的最后两张幻灯片:
结束语
广义基准分布通常会导致具有渐近正确频率覆盖率的有吸引力的解决方案。
许多模拟研究表明,广义基准解具有非常好的小样本特性。
目前在一些应用圈子中广义推理的流行表明,如果计算机在 70 年前可用,基准推理可能不会被拒绝。
引号
Zabell (1992) “基准推理是 RA Fisher 的一大失败。” Efron (1998) “也许费舍尔最大的错误将成为 21 世纪的重磅炸弹!"
只是为了添加更多参考,这里是我从 Hannig 的 2009 Statistics Sinica 论文中获取的参考列表。请原谅重复,但我认为这会有所帮助。
Burch, BD 和 Iyer, HK (1997)。混合线性模型中方差比(或遗传力)的准确置信区间。生物识别技术 53、1318-1333。
Burdick, RK, Borror, CM 和蒙哥马利, DC (2005a)。仪表 R&R 研究的设计和分析。ASA-SIAM 系列统计和应用概率。宾夕法尼亚州费城:工业和应用数学学会。
Burdick, RK, Park, Y.-J., Montgomery, DC 和 Borror, CM (2005b)。量规 R&R 研究中错误分类率的置信区间。J. 质量技术。37, 294-303。
蔡,TT (2005)。离散分布中的单边置信区间。J.统计学家。计划。推论 131, 63-88。
Casella, G. 和 Berger, RL (2002)。统计推断。Wadsworth and Brooks/Cole Advanced Books and Software,Pacific Grove,CA,第二版。
Daniels, L.、Burdick, RK 和 Quiroz, J. (2005)。具有固定运算符的量规 R&R 研究中的置信区间。J. 质量技术。37, 179-185。
Dawid, AP 和 Stone, M. (1982)。基准推理的功能模型基础。安。统计学家。10, 1054-1074。GA Barnard 和 DAS Fraser 进行了讨论,并得到了作者的答复。
Dawid, AP, Stone, M. 和 Zidek, JV (1973)。贝叶斯和结构推理中的边缘化悖论。J.罗伊。统计学家。社会党。爵士。B 35, 189-233。由 DJ Bartholomew、AD McLaren、DV Lindley、Bradley Efron、J. Dickey、GN Wilkinson、APDempster、DV Hinkley、MR Novick、Seymour Geisser、DAS Fraser 和 A. Zellner 讨论,以及 AP Dawid、M. Stone 的回复,和合资企业齐德克。
美联社登普斯特 (1966)。基于样本数据推理后验分布的新方法。安。数学。统计学家。37, 355-374。
美联社登普斯特 (1968)。贝叶斯推理的推广。(有讨论)。J.罗伊。统计学家。社会党。B 30, 205-247。
美联社登普斯特 (2008)。统计学家的 Dempster-Shafer 演算。国际近似推理杂志 48, 365-377。
E, L., Hannig, J. 和 Iyer, HK (2008)。不平衡二分量正态混合线性模型中方差分量的基准区间。J.阿米尔。统计学家。副教授。103、854-865。
埃夫隆,B.(1998 年)。RA 费舍尔在 21 世纪。统计学家。科学。13, 95-122。附有作者的评论和反驳。
费舍尔,RA (1930)。逆概率。剑桥哲学学会会议记录 xxvi, 528-535。
费舍尔,RA(1933 年)。逆概率和基准概率的概念是指未知参数。伦敦皇家学会会刊 A 139, 343-348。
费舍尔,RA (1935a)。统计推断中的基准论据。安。优生学六,91-98。
费舍尔,RA (1935b)。归纳推理的逻辑。J.罗伊。统计学家。社会党。B 98, 29-82。
弗雷泽,DAS (1961)。关于基准推理。安。数学。统计学家。32, 661-676。
弗雷泽,DAS (1966)。结构概率和概括。Biometrika 53, 1-9。
弗雷泽,DAS (1968)。推理的结构。John Wiley & Sons,纽约-伦敦-悉尼。
弗雷泽,DAS (2006)。基准推理。在新帕尔格雷夫经济学词典(S. Durlauf 和 L. Blume 编辑)中。帕尔格雷夫麦克米伦,第 2 版。关于广义基准推理 543
戈什,JK (1994)。高阶渐近。NSF-CBMS 区域会议系列。海沃德:数理统计研究所。
Ghosh, JK 和 Ramamoorthi, RV (2003)。贝叶斯非参数。施普林格统计系列。施普林格出版社,纽约。
格拉戈夫斯基,YS(2006 年)。柯西分布和正态分布混合的基准置信区间的构建。硕士论文,科罗拉多州立大学统计系。
格兰迪,下午(1956 年)。基准分布和先验分布:前者不能与后者关联的示例。J.罗伊。统计学家。社会党。爵士。B 18, 217-221。
口香糖 (1995)。测量不确定度表达指南。国际标准化组织 (ISO),瑞士日内瓦。
Hamada, M. 和 Weerahandi, S. (2000)。通过广义推理进行测量系统评估。J. 质量技术。32, 241-253。
Hannig, J. (1996)。关于作为鞅极限的条件分布。经理。论文,(捷克语),查尔斯大学,布拉格,捷克共和国。
Hannig, J., E, L., Abdel-Karim, A. 和 Iyer, HK (2006a) 对数正态分布均值比率的同时基准广义置信区间。澳大利亚。J.统计学家。35, 261-269。
Hannig, J.、Iyer, HK 和 Patterson, P. (2006b) 基准广义置信区间。J.阿米尔。统计学家。副教授。101、254-269。
Hannig, J. 和 Lee, TCM (2007)。小波回归的广义基准推断。技术。代表,科罗拉多州立大学。
Iyer, HK 和 Patterson, P. (2002)。构造广义关键量和广义置信区间的方法。技术。Rep. 2002/10,科罗拉多州立大学统计系。
Iyer, HK, Wang, CMJ 和 Mathew, T. (2004)。实验室间试验中真实值的模型和置信区间。J.阿米尔。统计学家。副教授。99、1060-1071。
杰弗里斯,H. (1940)。注意 Behrens-Fisher 公式。安。优生学 10, 48-51。
杰弗里斯,H. (1961)。概率论。克拉伦登出版社,牛津,第三版。
Le Cam, L. 和 Yang, GL (2000)。统计中的渐近线。施普林格统计系列。纽约:Springer-Verlag,第二版。
Liao, CT 和 Iyer, HK (2004)。具有多个方差分量的正态分布的容差区间。统计学家。中央 14, 217-229。
林德利,DV(1958 年)。基准分布和贝叶斯定理。J.罗伊。统计学家。社会党。爵士。B 20, 102-107。
McNally, RJ, Iyer, HK 和 Mathew, T. (2003)。基于广义 p 值的个体和群体生物等效性检验。医学统计 22, 31-53。
Mood, AM, Graybill, FA 和 Boes, DC (1974)。统计理论导论。麦格劳-希尔,第三版。
Pounds, S. 和 Morris, SW (2003)。通过近似和划分 p 值的经验分布来估计微阵列研究中假阳性和假阴性的发生。生物信息学 19, 123601242。
莎乐美,D.(1998 年)。通过基准方法进行星体推理。博士 论文,格罗宁根大学。第544章
Searle, SR, Casella, G. 和 McCulloch, CE (1992)。方差分量。纽约约翰威利父子公司。
史蒂文斯,WL(1950)。不连续分布参数的基准极限。生物计量学 37, 117-129。
徐,K.-W。和 Weerahandi, S. (1989)。在存在有害参数的情况下对假设进行显着性检验的广义 p 值。J.阿米尔。统计学家。副教授。84, 602-607。
Wang, CM 和 Iyer, HK (2005)。使用广义推断传播测量中的不确定性。计量学 42, 145-153。
Wang, CM 和 Iyer, HK (2006a)。存在 A 型和 B 型不确定性时被测量的广义置信区间。测量 39, 856–863。Wang, CM 和 Iyer, HK (2006b)。使用基准推断的向量被测量的不确定性分析。计量学 43, 486-494。
Weerahandi, S. (1993)。广义置信区间。J.阿米尔。统计学家。副教授。88, 899-905。
Weerahandi, S. (2004)。重复测量中的广义推理。威利,霍博肯,新泽西州。
威尔金森,GN (1977)。关于解决统计推断中的争议。J.罗伊。统计学家。社会党。爵士。B 39, 119-171。有讨论。
Yeo,I.-K。和约翰逊,RA(2001 年)。U 统计量的统一强数定律,适用于近对称变换。统计学家。概率。莱特。51、63-69。
扎贝尔,SL (1992)。RA Fisher 和基准论点。统计学家。科学。7, 369-387。北卡罗来纳大学教堂山分校统计与运筹学系,美国北卡罗来纳州教堂山市 27599-3260 电子邮件:hannig@unc.edu(2006 年 11 月收到;2007 年 12 月接受)
我从这篇文章得到这篇文章是 Statistica Sinica 19 (2009), 491-544 ON GENERALIZED FIDUCIAL INFERENCE∗ Jan Hannig The University of North Carolina at Chapel Hill
基准推理有时将可能性解释为参数的概率。也就是说,假设被解释为的概率密度函数,其中是的似然函数和。您可以查看Casella 和 Berger,第 291-2 页,了解更多详细信息。
补充一下,Fisher 和 Neyman 之间就显着性检验和区间估计存在争议。Neyman 定义了置信区间,而 Fisher 引入了基准区间。他们对自己的构造有不同的争论,但构造的间隔通常是相同的。因此,定义的差异在很大程度上被忽略了,直到发现它们在处理 Behrens-Fisher 问题时有所不同。费舍尔坚决主张基准方法,但尽管他的才华和对方法的强烈支持,但似乎存在缺陷,并且由于统计界认为它不可信,因此不被普遍讨论或使用。贝叶斯和频率论的推理方法是剩下的两种。
在乔治亚理工学院的一个大型本科工程介绍统计课程中,当讨论已知方差的总体均值的置信区间时,一位学生问我(用 MATLAB 语言):“我可以将区间计算为 > norminv(α/ 2,1-alpha/2], barX, sigma/sqrt(n))?" 翻译:他能否取为中心的正态分布的和分位数,尺度 ?
我说——当然是的,惊喜地发现他自然而然地到达了基准分布的概念。