夏皮罗-威尔克测试的解释

机器算法验证 r 分布 解释 拟合优度 正态假设
2022-01-23 21:17:16

我对统计很陌生,我需要你的帮助。
我有一个小样本,如下:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

我使用 R 运行了 Shapiro-Wilk 测试:

shapiro.test(precisionH4U$H4U)

我得到了以下结果:

 W = 0.9502, p-value = 0.6921

现在,如果我假设 0.05 的显着性水平比 p 值更大,那么 alpha (0.6921 > 0.05) 并且我不能拒绝关于正态分布的零假设,但它是否允许我说样本具有正态分布?

谢谢!

4个回答

不-您不能说“样本具有正态分布”或“样本来自具有正态分布的总体”,而只能说“您不能拒绝样本来自具有正态分布的总体的假设”。

事实上,样本没有正态分布(见下面的qqplot),但你不会期望它,因为它只是一个样本。关于基础人口分布的问题仍然悬而未决。

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

QQ图

未能拒绝零假设表明您拥有的样本太小而无法检测出您所拥有的任何与正态性的偏差 - 但您的样本太小以至于可能无法检测到与正态性的相当大的偏差。

然而,在大多数情况下,假设检验几乎与人们使用正态性检验无关——你实际上知道你正在测试的问题的答案——从你的数据中得出的人口分布不会是正常的. (有时可能非常接近,但实际上正常吗?)

您应该关心的问题不是“它们是从正常情况中提取的分布”(不会)。您实际上应该关心的问题更像是“偏离常态是否会对我的结果产生重大影响?”。如果这可能是一个问题,您可以考虑进行不太可能出现该问题的分析。

考虑到您对统计学很陌生,我怀疑您正在考虑这个问题,因为这些是均值估计的残差,并且您想知道正态性假设对于使用分布的置信估计是否有效。t

t检验对违反这一假设非常稳健,数据在亨利的 qq 图中看起来模糊正常,夏皮罗检验并不表明数据来自非正态分布的人群,所以我会说检验是合适的。t

我进一步推测您正在查看比例,在这种情况下,如果您担心违反假设,您可以使用二项分布。

如果是其他问题让您进行夏皮罗测试,您可以忽略我刚才所说的一切。

正如亨利已经说过的,你不能说这是正常的。只需尝试在 R 中多次运行以下命令:

shapiro.test(runif(9)) 

这将测试来自均匀分布的 9 个数字的样本。很多时候,p 值会远大于 0.05 - 这意味着您无法得出分布是正态的结论。