“基准”是什么意思(在统计的背景下)?

机器算法验证 贝叶斯 推理 术语 基准 罗纳德-费舍尔
2022-02-03 16:45:51

当我谷歌搜索

"fisher" "fiducial"

...我确实获得了很多点击,但我关注的所有点击都完全超出了我的理解范围。

所有这些热门歌曲似乎都有一个共同点:它们都是为彻头彻尾的统计学家写的,他们完全沉浸在统计学的理论、实践、历史和传说中。(因此,这些帐户都没有费心解释甚至说明费舍尔所说的“基准”是什么意思,而不求助于行话的海洋和/或将责任推卸给一些经典或其他数理统计文献。)

好吧,我不属于那些可以受益于我在这个主题上的发现的特定目标受众,也许这解释了为什么我每次试图理解费舍尔所说的“基准”的意思都撞到了一堵墙难以理解的胡言乱语。

有谁知道试图向非专业统计学家解释费舍尔所说的“基准”是什么意思?

PS我意识到Fisher在确定他所说的“基准”的含义时有点移动目标,但我认为该术语必须具有一些“恒定核心”的含义,否则它无法发挥作用(因为它很清楚确实)作为该领域内普遍理解的术语。

2个回答

基准论点是将可能性解释为概率即使可能性衡量了一个事件的合理性,它也不满足概率度量的公理(特别是不能保证它的总和为 1),这是这个概念从未如此成功的原因之一。

让我们举个例子。假设你想估计一个参数,比如半衰期λ的一种放射性元素。你进行几次测量,比如说(x1,,xn)你试图从中推断出的价值λ. 在传统的或常客的方法看来,λ不是随机量。它是一个具有似然函数的未知常数λni=1neλxi=λneλ(x1++xn).

在贝叶斯方法看来,λ是具有先验分布的随机变量;测量结果(x1,,xn)需要推导出后验分布例如,如果我对 lambda 值的先前信念很好地由密度分布表示2.3e2.3λ,联合分布是两者的乘积, 2.3λneλ(2.3+x1++xn). 后验是分布λ给定测量值,使用贝叶斯公式计算。在这种情况下,λ具有带参数的 Gamma 分布n2.3+x1++xn.

从基准推理的角度来看,λ也是一个随机变量,但它没有先验分布,只是一个基准分布,仅取决于(x1,,xn). 为了跟进上面的例子,基准分布是λneλ(x1++xn). 这与可能性相同,只是现在将其解释为概率。通过适当的缩放,它是一个带参数的 Gamma 分布nx1++xn.

这些差异在置信区间估计的背景下具有最显着的影响。经典意义上的 95% 置信区间是在收集任何数据之前有 95% 的机会包含目标值的构造然而,对于基准统计学家来说,95% 的置信区间是一个有 95% 的机会包含目标值的集合(这是对频率论方法的学生的典型误解)。

几位著名的统计学家试图重新点燃对费舍尔基准论点的兴趣。 Bradley Efron:(我什至无法从谷歌书籍中复制小引语),该主题也在Bradley Efron 2中得到处理。他说了一些大意的话(不是直接引用):基准推理,有时被认为是费舍尔最大的错误,可能是费舍尔未来最大的打击。所以有人认为 Fiducial 的想法会回来。

Schweder, T. & Hjort, NL (2016) 是一本专门讨论该主题的完整书籍(由我以前的一些教授撰写)。置信度、可能性、概率:具有置信度分布的统计推断剑桥大学出版社。

他们建议将术语从“基准分布”更改为“置信分布”。我什至在某个时候试图在这里制作一个新标签confidence-distribution但是有人错误地把它作为标签的同义词confidence-intervalGrrrr(如果是同义词,应该是 to fiducial。)