我想避免滥用正态性检验,因为足够大的样本量会突出任何轻微的非正态性。我想说一个分布“足够正常”。
当总体为非正态时,Shapiro-Wilk 检验的 p 值随着样本量的增加而趋于 0。p 值无助于确定分布是否“足够正常”。
我认为一个解决方案是测量非正态性的影响大小并拒绝任何比阈值更非正态的东西。
Shapiro Wilk 检验产生检验统计量. 这是衡量非正态性影响大小的一种方法吗?
我通过对从均匀分布中抽取的样本进行 shapiro wilk 测试在 R 中对此进行了测试。样本数量从 10 到 5000 不等,结果如下图所示。W 的值确实收敛到一个常数,它不趋向于. 我不确定是否对小样本有偏差,对于小样本量似乎很低。如果是对效果大小的有偏估计,如果我想接受以下任何内容,这可能是一个问题作为“足够正常”。
我的两个问题是:
是衡量非正态性的影响大小?
是偏向于小样本量?