MANOVA 的原假设是什么?

机器算法验证 假设检验 方差分析 马诺瓦
2022-03-29 15:11:43

背景

为了分析不同组之间某些连续变量的差异(由分类变量给出),可以执行单向方差分析。如果有多个解释(分类)变量,则可以执行阶乘 ANOVA。如果要分析多个连续变量(即多个响应变量)的组间差异,则必须执行多元方差分析(MANOVA)。

问题

我几乎不明白如何对几个响应变量执行类似 ANOVA 的测试,更重要的是,我不明白零假设可能是什么。是零假设:

  • “对于每个响应变量,所有组的均值相等”,

或者是

  • “对于至少一个响应变量,所有组的均值相等”,

或者是H0别的东西?

2个回答

零假设H0单向方差分析的一个特点是所有组的均值相等:

H0:μ1=μ2=...=μk.
零假设H0单向 MANOVA 的一个特点是所有组的 [多变量] 均值相等:这相当于说每个响应变量的均值相等,即您的第一个选项是正确的
H0:μ1=μ2=...=μk.

在这两种情况下,备择假设都是对原点的否定。在这两种情况下,假设是 (a) 组内高斯分布,和 (b) 跨组的相等方差(对于 ANOVA)/协方差矩阵(对于 MANOVA)。H1

MANOVA和ANOVA之间的区别

这可能看起来有点令人困惑:MANOVA 的原假设与单变量 ANOVA 集合的原假设组合完全相同,但同时我们知道进行 MANOVA 并不等同于进行单变量 ANOVA,然后以某种方式“组合”结果(可以想出各种组合方式)。为什么不?

答案是运行所有单变量 ANOVA,即使会检验相同的零假设,其功效也会降低。请在此处查看我的答案以获取说明:当单变量 ANOVA 均未达到显着性时,MANOVA 如何报告显着差异?“组合”的幼稚方法(如果至少有一个 ANOVA 拒绝零,则拒绝全局零)也会导致 I 类错误率的巨大膨胀;但即使一个人选择了一些聪明的“组合”方式来保持正确的错误率,一个人也会失去力量。

测试如何工作

ANOVA 将总平方和分解为组间平方和和组内平方和,因此然后它计算比率在原假设下,这个比率应该很小(大约);可以计算出在原假设下预期的该比率的确切分布(它将取决于和组数)。将观察到的值与此分布进行比较会产生 p 值。TBWT=B+WB/W1nB/W

MANOVA 将总散布矩阵分解为组间散布矩阵和组内散布矩阵,使得然后它计算矩阵在原假设下,这个矩阵应该是“小”的(在附近);但是如何量化它有多“小”呢?MANOVA 查看这个矩阵的特征值(它们都是正的)。同样,在原假设下,这些特征值应该是“小”(大约TBWT=B+WW1BIλi1)。但是要计算 p 值,我们需要一个数字(称为“统计量”)以便能够将它与它在 null 下的预期分布进行比较。有几种方法可以做到:取所有特征值的取最大特征值等。在每种情况下,将这个数字与在 null 下预期的这个数量的分布进行比较,从而得到一个 p 值。λimax{λi}

检验统计量的不同选择会导致 p 值略有不同,但重要的是要认识到在每种情况下都在检验相同的零假设。

是前者。

但是,它的方式并不是逐个比较每个原始变量的均值。相反,响应变量以与主成分分析非常相似的方式进行线性变换(这里有一个关于 PCA 的优秀主题:理解主成分分析、特征向量和特征值。)不同之处在于 PCA 将轴定向以与最大变化的方向对齐,而 MANOVA 将轴旋转到以下方向最大限度地分离您的组。

需要明确的是,与 MANOVA 相关的所有测试都不是在直接意义上一个接一个地测试所有均值,无论是原始空间中的均值还是转换空间中的均值。有几种不同的测试统计量,每种统计量的工作方式略有不同,但它们倾向于对变换空间的分解的特征值进行操作。但就原假设的性质而言,所有组的所有均值在每个响应变量上都是相同的,并不是说它们在某些变量上可以不同,但​​在至少一个变量上是相同的。