当总体具有已知的固定大小时,t 统计量的表是否错误?

机器算法验证 样本量 t检验 人口 有限种群
2022-04-10 23:42:19

据我了解,Student's t 将在样本量接近无穷大时渐近逼近 Z 统计量(请参阅大多数介绍性统计书籍中的无限自由度行中的自由度)。但是,当总体评估总体时,Z 检验适用。

因此,当总体规模有限、已知且相对较小时,t 统计量似乎可能过于保守。具体来说,如果总体为 50 并且您采样了 49,则似乎适当的临界值将更接近 Z(给定 alpha 标准)的相关临界值,而不是 t(给定 alpha 和自由度) .

在这些小人口案例中,t 是保守的吗?如果是这样,是否对 t 临界值进行了修正以解释人口较少的情况?

2个回答

当您的总体有限且样本量超过总体的 5-10% 时,您应该使用有限总体校正,即乘以标准误差时间NnN1,看这个链接

您仍应使用 t 分布,但标准误差会更小,以说明样本中的大部分人口。

Z 统计量和 t 统计量之间的区别在于 Z 统计量是渐近正态的,如果我们假设误差是正态的,则当 t 统计量具有精确的学生分布(具有适当的自由度)时。在小样本量中,差异可能相当大(实际上这就是学生“发明”t-统计量的原因,他可以使用非常小的样本量)。如果样本量较大,则 Z 统计量和 t 统计量的临界值更接近,因为当自由度趋于无穷大时,学生分布趋于正态。但是 z 统计量仍然只是一个近似值,因此使用精确分布仍然是有益的。当然,如果正态性假设不成立,则应使用 Z 统计量,因为那时学生的分布完全不是统计量的分布。