正态总体的小样本的抽样分布是正态分布还是 t 分布?

机器算法验证 分布 正态分布 采样 小样本 t分布
2022-03-16 15:30:35

如果我知道总体呈正态分布,然后从该总体中抽取样本,那么声称抽样分布是正态分布还是遵循t 分布更正确?

我知道小样本往往是 t 分布的,但这仅适用于潜在人口分布未知的情况吗?

谢谢!

2个回答

1) 来自具有分布的总体的一组随机观测值是来自该分布的样本。因此,即使是从正态总体中采样的单个值也呈正态分布。(好吧,更严格地说,代表单次平局的随机变量是正态分布的。)F

2) 如果观测值是从正态分布中独立抽取的,则样本均值是正态的。(如果它们是依赖的,那么依赖结构是什么很重要。)

3)如果数据是从正常人群中抽取的独立同分布的,那么这将是 t 分布的:t 统计量。(我们得到一些不正常的东西,因为有一个分子和一个分母)

我知道小样本往往分布不均

这是一种错误的理解。这种理解是建立在什么基础上的?

[这似乎是一种常见的误解,我只能假设它出现在某处流行或曾经流行的书中。如果您确实找到了这样一本书,请在您的问题或评论中发布详细信息,因为我很想知道它来自哪里。]

如果您打算从正态分布的总体中获取一个值,则该值具有与总体相同的概率密度函数。所以任何平局xi从人口XN(μ,σ2)将来自相同的人口分布N(μ,σ2)

所以这意味着小样本仍然是正态分布的,对吧?好吧,当然,如果每次抽奖都来自正态分布,那么它本身将具有正态分布(至少在我们实际进行抽奖之前)。

好像你在问x¯,因为我们讨论的是样本、t 分布等。x¯ 不是对于小样本仍然是正常的,虽然因为每次观察xi具有正态分布。为什么?因为它只是其他正态随机变量的总和!

Glen_b 在我混为一谈的地方取得了不错的成绩x¯t-统计。重要的是要注意,虽然x¯对于任何样本大小仍然是正常的(如果从中抽样的总体是正常的),t对于小样本量,从 Normal 样本构建的统计数据不是 Normal 的。为什么?

好吧,我们这里有两个不同的案例。有可能分布是已知的,在这种情况下,我们知道σ2. 也有可能σ2未知,在这种情况下,我们将不得不估计它。

1:我们知道σ2. 这意味着我们可以使用z直接从总体参数计算的统计量σ2.

如果我们确定σ2,然后我们可以执行例如假设检验x¯使用分布N(μ,σ2n). 特别是,我们可以对其进行标准化,将其转化为一个值Z, 分布为N(0,1)如果我们知道σ2,那么我们可以只使用标准正态分布进行计算。这是正常的,无论我们的样本有多大或多小!

2:我们不知道σ2, 所以我们估计它s2.

如果我们不知道σ2,那么我们需要用估计量的计算值代替真实的总体值。通常,这将是s2,样本方差。但是样本方差也有自己的分布!所以我们实际上并不确定它的价值。如果我们的样本量很小,那么“样本方差的方差”就足以影响方式x¯是分布式的。所以当我们标准化x¯,它不再是正态分布的,即使所有的xi计算它是分布正态的。

有关更多信息,请阅读t 分布的定义和样本方差的分布。