是否有可能获得大于 3 的 z 分数?

机器算法验证 z分数
2022-03-28 22:12:45

我正在对 361 名 18-62 岁以上的成年人进行心理学研究。我已经测试了各种变量,得到的 z 分数远远超过 3,例如 9、14 等。我被告知我的数据不正常。这是否意味着我的 z 分数是正确的,还是我做错了什么?

2个回答

对于数据点和具有均值和标准差的分布,z 分数只是因此,高 z 分数意味着数据点与平均值相差许多标准差。这可能会在/长尾分布中自然发生,或者可能表示异常值。一个好的第一步是绘制直方图或其他密度估计器并查看分布。xμσ(xμ)/σ

我将假设您的意思是由它们自己的样本统计数据标准化的变量。

对于正态分布的数据,在 n=361 时,大于 3 的值当然是可能的。事实上,最大量级的 z 分数应该在一半以上的时间超过 3。

这是来自正态分布总体的大小为 361 的样本的最大绝对 z 分数的分布。

在此处输入图像描述

如果您正在查看单个变量,那么对于从正态分布中抽取的样本,z 分数的最大幅度值远超过 4 会有些令人惊讶。如果您正在查看 20 个变量,您会期望其中一些大于 4,但您可能会发现像 4.6 左右这样的值有些令人惊讶。对于来自正态分布的大小为 361 的样本,远大于 5 的值通常是不可信的(从某种意义上说,至少有那么大的值将是极其罕见的情况),除非您查看了非常大量的变量。


但是,尚不清楚为什么您会关心这些变量中的任何一个是否可能是正态分布的(事实上,如果任何变量实际上是从正态分布中得出的,我会感到惊讶,但这通常不会产生任何后果)。

如果某个变量的分布是正态分布,那这有什么关系呢?

(你在做什么需要这些变量的正态分布?)