如果 n > 30,我们是否总是假设正态分布?

机器算法验证 正态分布 非参数 正态假设 强大的
2022-04-19 14:19:22

我正在与一位同事辩论,我开始怀疑我是否错了,但互联网让我更加困惑。

我们有连续数据是对个人进行回顾性选择的。选择是非随机的。我们的样本量约为我们的数据严重向左倾斜,尾部有一些强烈的颠簸。[0,)1000

我的策略是通过直方图、qq 图和 Shapiro Wilk 检验在两组之间进行统计测试之前查看数据的分布。如果数据大致正常,我会使用适当的测试(t 检验、方差分析、线性回归等)。如果不是,我使用适当的非参数方法(Mann-Whitney 检验、Kruskal-Wallis、Bootstrap 回归模型)。

如果样本量 > 30 或 > 50,我的同事不会查看分布,他会自动假设它是正常的,并引用中心极限定理来使用 t 检验或 ANOVA。

他们引用了这篇论文:t 检验、非参数检验和大型研究——统计实践的悖论?并说我过度使用非参数测试。我的理解是我的方法会告诉我是否适合进行正态分布,因为我认为对于严重偏斜的数据,达到〜正态分布的 n 更高。我知道如果样本量足够大,它最终会到达那里,但特别是对于较小的样本量,检查不是更好吗?对我来说,由于多次测试表明数据不正常,因此使用正态分布是不合适的。此外,如果假设正态性只需要 30 个样本量,为什么要在统计软件中的其他分布上做这么多工作?那时一切都将是正态分布或非参数化。为什么要打扰二项式分布或伽马分布?但是他们一直给我发关于中心极限定理的论文,现在我不太确定。也许我错了,我不应该费心检查这些假设。

谁是对的,为什么?

2个回答

我的策略是通过直方图、qq 图和 Shapiro Wilk 检验在两组之间进行统计测试之前查看数据的分布。如果数据大致正常,我会使用适当的测试(t 检验、方差分析、线性回归等)。如果不是,我使用适当的非参数方法(Mann-Whitney 检验、Kruskal-Wallis、Bootstrap 回归模型)。

什么是“大约正常”?您是否需要通过假设检验才能充分接近正态?

一个问题是,当样本量增加时,这些正态性检验变得更加强大(更有可能拒绝正态性),甚至可以在偏差非常小的情况下拒绝。具有讽刺意味的是,对于较大的样本量,与正态性的偏差不太重要。

如果样本 > 30 或 > 50,我的同事不会查看分布,他会自动假设它是正常的,并引用中心极限定理来使用 t 检验或 ANOVA。

如果 n > 30,我们是否总是假设正态分布?

说“总是”有点强烈。同样,说可以假设正态性也是不正确的(相反,我们可以说偏离正态性的影响可以忽略不计)。

Morten W Fagerland 的文章解决的问题不是 t 检验是否在 n>30 时有效(在 n=30 时效果不佳,这也可以在图中看到,并且它需要像他们的表一样的大量数字它使用样本大小 1000)。问题是像 Wilcoxon-Mann-Whitney (WMW) 这样的非参数检验不是正确的解决方案,这是因为 WMW 正在回答一个不同的问题。WMW 检验不是均值或中位数相等的检验。

在文章中没有说“从不”使用 WMW。或者总是使用 t 检验。

WMW 测试是一个糟糕的测试吗?不,但它并不总是 t 检验的合适替代方案。WMW 检验对于分析有序数据最有用,也可用于较小的研究中,在某些条件下,以比较均值或中位数。

根据情况,一个人可能总是使用 t 检验而不分析正态性,因为可能发生分布的经验。当然,可以考虑示例/情况,其中 30 或 50 样本中的 t 检验功能要弱得多(p 值太高),但如果您从不处理这些示例,那么您始终可以使用 t 检验。


别的东西。

如果您的样本量为 1000,那么您可能会认为不仅平均值很重要,而且您可以查看的不仅仅是平均值的差异。在这种情况下,WMW 测试实际上并不是一个坏主意。

随着样本量的增加,数据不会接近正态分布。

相反,更接近正态分布的是样本均值样本总和。

如果人口分布非常不平衡,那么您可能需要远远超过而事实并非如此,那么也许就足够了。30,10