如何测试 2x2 ANOVA 的正态性?

机器算法验证 方差分析 spss 残差 假设 正态假设
2022-03-03 16:21:27

研究设计:我向参与者展示了一些关于海平面上升的信息,并以不同的方式关注这些信息,包括时间尺度和潜在上升的幅度。因此,我有一个 2(时间:2050 或 2100)乘 2(幅度:中或高)设计。还有两个对照组没有收到任何信息,只回答我的 DV 的问题。

问题: 我一直检查单元格内的正态性——对于这个设计的 2x2 部分,这意味着在 4 个组内寻找正态性。然而,在这里阅读一些讨论让我再次猜测我的方法。

首先,我读过我应该查看残差的正态性。如何检查残差的正态性(在 SPSS 或其他地方)?我是否必须为 4 组(包括控件在内的 6 组)中的每一个都执行此操作?

我还读到组内的正态性意味着残差的正态性。这是真的?(文献参考?)同样,这是否意味着分别查看 4 个单元格中的每一个?

简而言之,将采取哪些步骤来确定您的 (2x2) 数据是否不违反正态假设?

参考总是受到赞赏,即使只是为了指出我正确的方向。

2个回答

大多数统计软件包都有保存模型残差的方法。在 SPSS 中使用GLM - UNIVARIATE可以保存残差。这将为您的数据文件添加一个变量,表示每个观察的残差。

一旦你有了你的残差,你就可以检查它们,看看它们是否是正态分布的、同方差的等等。例如,您可以对残差变量使用正式的正态性检验,或者更恰当地说,您可以绘制残差图以检查是否存在与正态性的任何重大偏离。如果你想检查同方差性,你可以得到一个按组查看残差的图。

对于基本的主体间因子方差分析,其中方差同质性成立,单元格内的正态性意味着残差的正态性,因为您在方差分析中的模型是预测组均值。因此,残差只是组均值和观察数据之间的差异。

回复以下评论:

  • 残差是相对于您的模型预测定义的。在这种情况下,您的模型预测就是您的单元均值。如果您专注于绘制残差而不是绘制单个单元格均值,那么这是一种更通用的假设检验思维方式,即使在这种特殊情况下,它们基本相同。例如,如果您添加协变量 (ANCOVA),则残差将比单元格内的分布更适合检查。
  • 为了检查正态性,标准化和非标准化残差将提供相同的答案。当您尝试识别数据建模不佳的数据(即异常值)时,标准化残差可能很有用。
  • 据我所知,方差同质性和同方差性的含义相同。再一次,通过比较组/单元之间的方差来检查这个假设是很常见的。在您的情况下,无论您是计算每个单元格的残差方差还是基于每个单元格中的原始数据,您都会得到相同的值。但是,您也可以在 y 轴上绘制残差,在 x 轴上绘制预测值。这是一种更通用的方法,因为它也适用于其他情况,例如添加协变量或进行多元回归。
  • 下面提出了一点,即当您具有异方差性(即,细胞内的方差在总体中的细胞之间变化)和细胞内的正态分布残差时,所有残差的结果分布将是非正态的。结果将是变量的混合分布,均值为零,不同方差的比例相对于像元大小。结果分布不会有零偏斜,但可能会有一定的峰度。如果将残差除以其相应的单元内标准差,则可以消除效应异方差;绘制得到的残差将提供对残差是否呈正态分布且独立于任何异方差的整体检验。

尽管许多介绍性教科书都强调它,但您并不需要 Normality。通过适度的样本量和每个组内的相同方差,即同方差性,ANOVA 将提供关于组间平均响应差异的准确推断。如果有理由怀疑非恒定方差 - 并且很可能存在 - 那么可以使用异方差一致的标准误差。

这些属性是众所周知的 t 检验的扩展;对于恒定方差,您可以使用“普通香草”t 检验,无论正态性如何(Fisher 已知的结果,回溯),并且在非恒定方差的情况下,不等方差在没有正态性的情况下也可以正常工作。不等方差版本等效于使用异方差一致标准误的 Wald 检验。