为什么 t 统计量随着样本量的增加而增加?

机器算法验证 t检验 p 值
2022-03-21 23:55:45

我有一个关于阅读 t 检验 p 值的问题。如果我理解正确,则 t 统计量计算为:

t=X¯μσ/n

其中,是样本均值,是总体均值,是样本标准差,是样本大小。自由度为X¯μσnn1

)成反比较高会导致较小的标准误差,从而产生较高的 t 值。较高的 t 值意味着较低的 p 值,推断样本均值 ( ) 和总体均值 ( ) 之间的差异是显着的(因此我们拒绝原假设)。σ/nnX¯μ

但是这个公式对我来说似乎违反直觉,因为更大的样本量(更高的)应该使样本均值更接近总体均值。n

我们如何解释这一点?

3个回答

符号的一点改变可能有助于回答您的问题:您所说通常称为,因为它是原假设下的总体均值,而是实际总体均值 - 这是未知的,因为我们不知道原假设是否为真。此外,您所说通常称为,遵循总体参数获取希腊字母的约定,样本参数用拉丁字母表示。μμ0μσs

请注意,是平均值可变性的估计,其中被理解为随机变量。所以我们有s/nX¯X¯X¯

t=X¯μ0s/n

现在,对于给定的样本,您有一个固定的经验,因此有一个固定的差异部分混淆似乎与“更大的样本量(更高的)应该使样本均值更接近总体均值”的想法有关。这应该改写为以零假设为真)为条件,观察到差异的概率至少与增加时,已经观察到变得更小。的“准确度”X¯empdemp=X¯empμ0nμ=μ0d=X¯μ0dempnX¯然后增加(变异性减小)。

我想主要的一点是你已经有一个固定的和因此,而只是告诉你“差异有多大”以(估计的)可变性单位来衡量当单位的绝对数量变小时,相同的绝对差将“值得更多单位”,因此如果 .X¯empdemptX¯dempμ=μ0

其他人可能会给出更严格的答案,但是:

之间的任何给定(固定)差异,如果 n 很高,则差异更有意义。X¯μ

增加 n导致样本均值更接近总体均值,但前提是您的样本与总体没有差异。所以当 n 很高并且仍然不同于时,这加强了对原假设的拒绝。X¯μ

你的最后一句话似乎概括了混乱。

你写了

但是这个公式对我来说似乎违反直觉,因为更大的样本量(更高的 n)应该使样本均值更接近总体均值。

但只有当样本来自与被比较的总体具有相同均值的总体时,这才是正确的。“人口”一词被用来指代两个不同的人口