随机变量的分数是的该参数的对数似然的。
我无法解释这个数量。为什么叫“分数”?
随机变量的分数是的该参数的对数似然的。
我无法解释这个数量。为什么叫“分数”?
这是一个有趣的历史好奇心。“分数”一词最初在Fisher (1935)中用于一个统计问题,该问题涉及分析父母有遗传异常的家庭的遗传特性。费舍尔指出,异常父母的孩子可以分为四类,即他们的二元遗传状态(异常的遗传或非遗传)和二元合子性(纯合子或杂合子)的组合。
费舍尔提出,可以根据这四个类别中每个类别的孩子数量,给在数据中观察到的一个家庭一个“分数”,这个分数可以用来估计描述他的问题中感兴趣的遗传概率的关联参数。他测量了他提出的分数的效率,以及另一位作者的替代评分规则,通过将两者与通过为每个数据点分配一个等于采样密度对数导数的分数而获得的“理想分数”进行比较(第 193 页) )。
在后来的工作中,其他作者遵循了费舍尔的分析方法,但将其应用于更一般的环境,他们不再试图为遗传问题中的家庭分配“分数”。在后来的工作中,作者仍然谈到“分数”或“有效分数”,但他们在更广义的意义上使用它,作为对数似然的导数的直接参考。这一进展在Rao (1948)的一篇论文中达到了高潮,其中作者使用对数似然函数的导数引入了“有效分数测试”。
因此,“分数”一词最初是费舍尔在特定的统计学应用中使用的一个术语,用于解决涉及家庭中儿童遗传特性的问题。他根据四个感兴趣类别的儿童数量给每个家庭一个“分数”来估计遗传概率。然后其他作者更广泛地使用该术语来指代费舍尔所说的“理想分数”,这是对数似然的导数。
阅读 Fisher 论文的注意事项:这篇论文有点难以阅读,因为它使用了统计推断方法,但以过时的方式描述它们。费舍尔提到了统计推断方法和信息论,但没有给出他的步骤的参考。基本上他所说的是以下内容。
假设我们令为观测值的密度,为对应的对数密度,参数为。分配给单个数据点的“理想分数”(例如,遗传类别中的儿童计数)是:
整个数据集的理想分数(例如,一个家庭在几个遗传类别中的计数)是通过将数据点的各个分数相加获得的,得出:
如您所见,这只是整个数据集的对数似然函数的导数(我们现在称为“得分函数”)。费舍尔使用术语“分数”在一般意义上应用于一个单位(一个家庭)的数量来为他的目的在一个尺度上对这些单位进行排名。他清楚地看到,对数似然的导数代表了这个“分数”的“理想”,就他的工作而言。