考试成绩真的服从正态分布吗?

机器算法验证 正态分布 广义线性模型 伽马分布 逆高斯分布
2022-03-16 17:16:57

我一直在尝试了解在 GLM 中使用哪些分布,但我对何时使用正态分布有点困惑。在我教科书的一部分中,它说正态分布可能有利于模拟考试成绩。在下一部分中,它询问什么样的分布适合模拟汽车保险索赔。这一次,它说适当的分布将是 Gamma 或逆高斯分布,因为它们是连续的,只有正值。好吧,我相信考试成绩也会是连续的,只有正值,那我们为什么要在那里使用正态分布呢?正态分布不允许负值吗?

3个回答

例如,高度通常被建模为正常值。也许男人的身高大约是 5 英尺 10 英寸,标准偏差为 2 英寸。我们知道负高度是非物理的,但在这个模型下,观察到负高度的概率基本上为零。无论如何,我们都使用该模型,因为它是一个足够好的近似值。

所有模型都是错误的。问题是“这个模型是否仍然有用”,并且在我们对身高和考试成绩等事物进行建模的情况下,将现象建模为正常现象是有用的,尽管它在技术上允许非物理事物。

正态分布不允许负值吗?

正确的。它也没有上限。

在我教科书的一部分中,它说正态分布可能有利于模拟考试成绩。

尽管有前面的陈述,但有时情况确实如此。如果您有许多要测试的组件,并且相关性不是太强(例如,您基本上不是同一个问题十几次,也不是每个部分都需要对前一部分的正确答案),并且不是很容易或很难(因此大多数标记都位于中间附近),那么标记通常可以通过正态分布合理地近似;通常足够好,以至于典型的分析应该很少引起关注。

我们确定它们不正常,但这不会自动成为问题——只要我们使用的程序的行为与我们的目的足够接近(例如标准误差、置信区间、显着性水平)和权力——无论是什么需要——做接近我们期望他们做的事)

在下一部分中,它询问什么样的分布适合模拟汽车保险索赔。这一次,它说适当的分布将是 Gamma 或逆高斯分布,因为它们是连续的,只有正值。

是的,但更重要的是——它们往往是严重的右偏,当平均值变大时,变异性往往会增加。

以下是车辆索赔的索赔规模分布示例:

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(图 5 来自 Garrido, Genest & Schulz (2016)“保险索赔的相关频率和严重程度的广义线性模型”,保险:数学和经济学,第 70 卷,9 月,第 205-215 页。https ://www.sciencedirect。 com/science/article/pii/S0167668715303358

这显示了典型的右斜和重的右尾。但是我们必须非常小心,因为这是一个边际分布,我们正在为条件分布编写一个模型,该模型通常偏斜度要小得多(如果我们只是将索赔大小的直方图看成是混合的,那么我们所看到的边际分布这些条件分布)。然而,通常情况下,如果我们查看预测变量子组中的声明大小(可能对连续变量进行分类),分布仍然是强烈的右偏斜并且在右侧非常重尾,这表明像伽马模型*这样的东西是可能比高斯模型更合适。

* 可能有任何数量的其他分布比高斯分布更合适——逆高斯分布是另一种选择——尽管不太常见;对数正态或 Weibull 模型虽然不是 GLM,但也可能非常有用。

[很少有这些分布是近乎完美的描述;它们是不精确的近似值,但在许多情况下足够好,分析是有用的并且具有接近所需属性。]

好吧,我相信考试成绩也会是连续的,只有正值,那我们为什么要在那里使用正态分布呢?

因为(在我之前提到的条件下 - 很多组件,不太依赖,不太难或容易)分布往往相当接近对称,单峰而不是重尾。

通过二项分布可能更好地模拟考试成绩。在一个高度简化的情况下,您可能有 100 道真/假问题,每道 1 分,因此分数将是 0 到 100 之间的整数。如果您假设应试者对问题的正确性之间没有相关性(尽管假设很可疑) ),分数是独立随机变量的总和,适用中心极限定理。随着问题数量的增加,正确问题的比例收敛到正态分布。

您对小于 0 的值提出了一个很好的问题。您也可以对大于 100% 的值提出相同的问题。随着测试题数量的增加,总和的方差减小,因此峰值被拉向均值。类似地,最佳拟合正态分布将具有较小的方差,并且 [0, 1] 区间之外的 pdf 的权重趋于 0,尽管它始终为非零。“分数正确”的可能值之间的空间也将减小(100 个问题为 1/100,1000 个问题为 1/1000,等等),因此非正式地,pdf 开始表现得越来越像一个连续的 pdf。