如果我知道总体呈正态分布,然后从该总体中抽取小样本,那么声称抽样分布是正态分布还是遵循t 分布更正确?
我知道小样本往往是 t 分布的,但这仅适用于潜在人口分布未知的情况吗?
谢谢!
如果我知道总体呈正态分布,然后从该总体中抽取小样本,那么声称抽样分布是正态分布还是遵循t 分布更正确?
我知道小样本往往是 t 分布的,但这仅适用于潜在人口分布未知的情况吗?
谢谢!
1) 来自具有分布的总体的一组随机观测值是来自该分布的样本。因此,即使是从正态总体中采样的单个值也呈正态分布。(好吧,更严格地说,代表单次平局的随机变量是正态分布的。)
2) 如果观测值是从正态分布中独立抽取的,则样本均值是正态的。(如果它们是依赖的,那么依赖结构是什么很重要。)
3)如果数据是从正常人群中抽取的独立同分布的,那么这将是 t 分布的:t 统计量。(我们得到一些不正常的东西,因为有一个分子和一个分母)
我知道小样本往往分布不均
这是一种错误的理解。这种理解是建立在什么基础上的?
[这似乎是一种常见的误解,我只能假设它出现在某处流行或曾经流行的书中。如果您确实找到了这样一本书,请在您的问题或评论中发布详细信息,因为我很想知道它来自哪里。]
如果您打算从正态分布的总体中获取一个值,则该值具有与总体相同的概率密度函数。所以任何平局从人口将来自相同的人口分布
所以这意味着小样本仍然是正态分布的,对吧?好吧,当然,如果每次抽奖都来自正态分布,那么它本身将具有正态分布(至少在我们实际进行抽奖之前)。
好像你在问,因为我们讨论的是样本、t 分布等。 不是对于小样本仍然是正常的,虽然因为每次观察具有正态分布。为什么?因为它只是其他正态随机变量的总和!
Glen_b 在我混为一谈的地方取得了不错的成绩和-统计。重要的是要注意,虽然对于任何样本大小仍然是正常的(如果从中抽样的总体是正常的),对于小样本量,从 Normal 样本构建的统计数据不是 Normal 的。为什么?
好吧,我们这里有两个不同的案例。有可能分布是已知的,在这种情况下,我们知道. 也有可能未知,在这种情况下,我们将不得不估计它。
1:我们知道. 这意味着我们可以使用直接从总体参数计算的统计量.
如果我们确定,然后我们可以执行例如假设检验使用分布. 特别是,我们可以对其进行标准化,将其转化为一个值, 分布为如果我们知道,那么我们可以只使用标准正态分布进行计算。这是正常的,无论我们的样本有多大或多小!
2:我们不知道, 所以我们估计它.
如果我们不知道,那么我们需要用估计量的计算值代替真实的总体值。通常,这将是,样本方差。但是样本方差也有自己的分布!所以我们实际上并不确定它的价值。如果我们的样本量很小,那么“样本方差的方差”就足以影响方式是分布式的。所以当我们标准化,它不再是正态分布的,即使所有的计算它是分布正态的。