样本量不等的两个样本之间的方差比较

机器算法验证 假设检验 非参数 偏见 f检验 levenes-测试
2022-03-24 23:47:15

我分析的主要目标是比较样本 1 和样本 2 之间响应变量血压的变异性。次要目标是检验均值的差异。我还没有数据,但我知道 sample1,n=167 和 sample2,n=998。可以假定它们是独立的。

我目前的数据计划:

1) 执行 Shapiro-Wilk 测试以评估正常性。

2)如果数据不正常,进行Levene等方差检验。如果数据正常,则进行 F 检验。

3) 执行 Mann-Whitney 检验(Wilcoxon 检验)以比较均值差异。或者,如果数据正常,则进行 Welch t 检验。

我的担忧:

  • 我已经读过,当 N 很大时,可以假设数据是正常的(中心极限定理),但找不到什么会构成“大”。这个数据可以被认为是正常的吗?

  • 我假设 sample1 的响应变异性较小,但是鉴于样本量的巨大差异,Levene 的检验/F 检验是否可靠/有足够的能力?是否有任何对样本量差异更稳健的等方差检验?

  • 我读过,如果数据不正常,您可以尝试转换数据。考虑到变换后方差可能会减小,这是否也适用于 F 检验?还是非参数测试会更好?

1个回答

位置差异

Mann-Whitney 不检验均值差异

我将从取消简单的问题开始。如果您关于位置差异的主要问题是均值差异,那么您可能不想要像 Mann-Whitney 检验这样的非参数检验。Mann-Whitney 检验是对随机优势的检验。所以给定两组A和B,如果我从A和B中随机抽取,哪个值会更大。如果它们平均抵消,则不存在随机优势;反之亦然。无论非正态性或异方差性如何,该检验都将起作用。但是,如果您特别具有非正态性和异方差性,则此检验绝不是对均值差的检验。均值差可以为零,但您可以很容易地使一组随机优势超过另一组。鉴于选择,

非正态性可能不太重要

下一个问题是与均值差相关的正态性。我们将再次提出关于方差差异的正态性,因为那里的工作方式有所不同。除非您期望数据非常非正态,否则您拥有的样本量可能大到足以忽略正态性问题。如果数据非常非正态,或者您可以假设它们可能产生的理论分布,那么使用该分布运行模型可能会更好,例如计数数据或收入的泊松。此外,某些转换在理论上可能有意义,因此您甚至可以在查看数据之前使用它们。我要说明的是与平均差异有关,异方差在您的情况下可能更为重要。

如果您必须检查正态性,知道所有其他事物都保持不变,那么统计测试会提高它们在更大样本量的情况下检测差异的能力。Shapiro-Wilk 可能能够在您拥有的样本量下检测到与正态性的微小偏差。此外,如果您完全进行测试,您可能应该在减去组均值后对数据进行测试。但最重要的是,根据此类初步测试做出未来决定可能会使您的最终决定存在缺陷。我不知道具有正态性检验的那种研究,但是有这样的异方差检验研究,请参阅:

处理异方差

因此,如果您关于位置差异的主要问题是均值差异,那么我的建议是计算均值差异并使用可以调整可能违反异方差的测试。最发达的需要很少额外的计算机时间(狂野的自举很好,但可能需要很长时间)是计量经济学中的异方差一致标准错误。我会推荐 HC3、HC4 或 HC5 变体。看:

这些方法比 Welch 的校正更近一些,并且不需要您知道方差的正确模型规范。因此,对组的结果进行回归,系数是您的平均差,并且稳健的误差校正可以纠正异方差的 p 值。有一些方法可以让您同时对均值和方差进行建模,例如广义最小二乘法,但数据的正态性在方差检验中重新发挥作用。我希望以上内容有助于解决有关平均差异的问题。

方差差异

我进行的简要模拟

接下来我转向另一个关于方差差异的主要问题。我在几周前进行了一些模拟。我假设结果的均值和方差仅是组的函数在随机试验中会遇到的简化假设。我变了:

  • 数据的分布,正态或偏态(χ82居中并按比例缩放以满足均值和方差要求1 的偏斜渐近)。的选择χ2不适合生成偏斜数据,尤其是在不平衡设计下,但我认为这就足够了。
  • 平衡与不平衡设计(1:3,所以不像你的情况那么极端)。

我考虑的最大样本量是两组中的 200 人。

我测试了我认为保持标称错误率和统计功效的方法的能力。现在要解决功效问题,在样本量低于 OP 的情况下,大多数方法在检测方差差异方面显示出相似的统计功效。但并非所有人都有能力保持名义错误率。所以当我使用表现相对较好的情况下,我的意思是保持名义错误率。

在平方残差上使用中位数和 OLS 的 Levene 检验可能是不错的选择

最标准的方法是F-测试。但是除非你的数据是正态分布的,否则这个测试的表现非常糟糕。所以人们可以把它从桌子上拿下来。下一个标准是 Levene 的测试。如果您担心正态性,可以通过使用中位数代替检验公式中的平均值进行 Levene 检验来加强它。在我进行的模拟中,这种方法似乎在各种情况下都表现得相对较好,应该可以在主要的统计软件包中使用。NIST 工程统计手册中的建议支持我自己的模拟结果:https ://itl.nist.gov/div898/handbook/eda/section3/eda35a.htm 。

但是,我还发现您可以从您进行的第一次回归中获取结果以获得平均差异。将此回归的残差平方,然后再次将此平方残差回归到组变量上。我发现这种测试方差差异的方法在我的模拟中的所有条件下都表现良好。

总之

因此,回顾一下,如果我处于您的境地,并且想在假设非正态性不是极端的前提下做出明智的决定,我会:

  • 进行标准回归模型,对组成员数据进行回归以获得平均差,并使用异方差一致的标准误进行推断
  • 我会使用中位数而不是平均值进行 Levene 检验。我也可以使用残差平方回归方法。

我测试的其他方法是使用 Hodges-Lehmann 中位数(与上述 Mann-Whitney 相关的一个很好的稳健估计量)作为中心的 Levene 检验;广义最小二乘;以及结构方程建模文献中的三种方法:对角加权最小二乘法、均值和方差调整的 OLS,以及使用通常称为MLM的夹心估计器的极大似然法。我在大部分文本中关注的方法胜出。