背景:我正在向同事进行假设检验的工作演示,并且理解其中大部分内容很好,但有一个方面让我自己陷入困境,试图理解并向其他人解释它。
这是我认为我知道的(如果有错误请更正!)
- 如果方差已知,统计量将是正态的,如果方差未知,则遵循分布
- ,样本均值的采样分布近似正态(可能是 ,对于高度偏斜的分布可能高达
- 自由度的
在以下情况下使用测试:
- 已知总体正态和方差(对于任何样本量)
- 总体正常,方差未知且(由于 CLT)
- 人口二项式, ,
在以下情况下使用检验:
- 总体正常,方差未知且
- 不了解总体或方差且,但样本数据看起来正常/通过测试等,因此可以假设总体正常
所以我只剩下:
- 和 (?)的样本,不了解已知/未知的总体和方差。
所以我的问题是:
当采样分布看起来不正常时,您可以假设(不了解总体分布或方差的情况下)平均值的采样分布是正常的(即 CLT 已经开始)的样本量是多少?我知道有些发行版需要,但是有些资源似乎说 -test ...
对于我不确定的情况,我假设我查看数据是否正常。现在,如果样本数据看起来正常,我是否使用 -test(因为假设总体正常,并且因为)?
我不确定的案例的样本数据在哪里看起来不正常呢?在任何情况下您仍然会使用 -test 或 -test,或者您是否总是希望转换/使用非参数测试?我知道,由于 CLT,在的某个值下,平均值的抽样分布将接近正常,但样本数据不会告诉我的值是多少;样本数据可能是非正态的,而样本均值遵循正态 /。是否存在您要转换/使用非参数检验的情况,而实际上均值的抽样分布是正态的/但您无法分辨?