您能帮我理解或向我推荐有关分数总和的抽样分布的来源吗?我知道如何获得均值的抽样分布以构建 t 检验等。更具体地说,分数总和的抽样分布的可变性如何与总体中基础变量的可变性相关。例如,人们互相传递沙袋。我测量了 n=10 人样本通过袋子的总时间,并计算平均值。如果我重复这个抽样,我将得到样本均值的标准差,然后我可以计算总体的变异性。假设一个相对正常的过程,即使我正在测量时间等。问题是如果我每次测量相同的 10 个人通过袋子的样本。样本是相关的。有什么建议吗?
分数总和的抽样分布是什么?
机器算法验证
假设检验
采样
2022-04-09 06:17:29
1个回答
您建议您对假设近似正态性感到满意。然后很简单——多元正态变量的线性组合本身就是正态的。均值和方差遵循均值和方差的基本属性。
如果则。
在总和的情况下,。也就是说,总和是正常的,其中总和的均值是均值之和,总和的方差是所有方差之和 + 所有成对协方差之和的两倍。
此外,如果该系列不太依赖并且是 iid 或独立的,并且它们中的任何一个相对于所有其他系列都没有太大的方差,则 CLT 肯定适用,所以如果有足够的术语,你应该有那个是正常的。注意。
从那里开始,如果您认为足够大,可以在某个时候使用正态近似值,您也可以为总和取消一个(CLT - 关于限制 - 不适用于未缩放的总和,但质量在某个特定处的 cdf 的近似值延续到总和)。然而,这些需要的样本量可能非常大。
除此之外,在各种情况下都可能发生适当缩放的总和收敛到正态性。同样,样本量可能需要很大。