夏皮罗威尔克检验 W 是效应量吗?

机器算法验证 假设检验 正态假设 规模效应
2022-03-07 03:04:57

我想避免滥用正态性检验,因为足够大的样本量会突出任何轻微的非正态性。我想说一个分布“足够正常”。

当总体为非正态时,Shapiro-Wilk 检验的 p 值随着样本量的增加而趋于 0。p 值无助于确定分布是否“足够正常”。

我认为一个解决方案是测量非正态性的影响大小并拒绝任何比阈值更非正态的东西。

Shapiro Wilk 检验产生检验统计量W. 这是衡量非正态性影响大小的一种方法吗?

我通过对从均匀分布中抽取的样本进行 shapiro wilk 测试在 R 中对此进行了测试。样本数量从 10 到 5000 不等,结果如下图所示。W 的值确实收敛到一个常数,它不趋向于1. 我不确定是否W对小样本有偏差,对于小样本量似乎很低。如果W是对效果大小的有偏估计,如果我想接受以下任何内容,这可能是一个问题W=0.1作为“足够正常”。

我的两个问题是:

  1. W衡量非正态性的影响大小?

  2. W偏向于小样本量?

阴谋

1个回答

如你所知,W是一个检验统计量。在大多数情况下(所有一致的测试),测试统计量不是合适的效果估计量,因为统计量反映了样本量,而效果估计量应独立于它。想想在中心极限定理下检验零均值的渐近检验:近似分布对所有n,因此检验统计量甚至包含有关样本量的所有信息。这使得检验统计量不适合作为效果估计器。

为了W,它是相似的(尽管近似分布也取决于样本量)。下限为Wa12n(n1), 在哪里a1取决于是对最小阶统计量的期望。

所以不,它根本不是合适的效果估计器。

事实上,我认为你还不确定你在寻找什么,因为术语“效果”比一维参数的通常参数世界更难一些。在这里,非正态分布的原始效果是无限维的:R可以有与正态分布模型不同的概率。对于一维效果,您需要以某种方式对其进行加权,并了解各种权重对您的预期应用的影响。通过这种方式,您将决定例如具有高斯尾的某个双峰分布是否比具有重尾的某个单峰分布更正常。事实上,将尾部行为与非尾部行为进行交易可能是发明合适效果的最相关问题。

然后,如果找到这个特定效果的估计器会容易得多。