在单个预测变量的情况下了解 MANOVA

机器算法验证 假设检验 多元分析 多重比较 马诺瓦
2022-04-06 14:37:53

我试图理解我在临床研究中看到的统计分析。他们用一系列绩效指标(A、B、C、...、N)测量了 3 组受试者的表现。目的是找出 3 组的表现之间是否存在差异,如果是,那么它们在哪些方面存在差异。

他们的分析包括进行这样的 MANOVA:

set.seed(100)
group <- rep(c(0,1), each=40)
A <- rnorm(80, 5, .5) + .1 * group
B <- rnorm(80, 9, .3) + .2 * group + .5 * A
C <- rnorm(80, 12, .3) + .2 * group + .7 * B
d.1 <- data.frame(A = A, B = B, C = C, group = group)

fit.manova <- manova(cbind(A, B, C) ~ group, d.1)
summary(fit.manova, test="Pillai")

          Df  Pillai approx F num Df den Df    Pr(>F)    
group      1 0.19669   6.2027      3     76 0.0007949 ***
Residuals 78

当他们表明他们看到了显着差异时,他们继续对每个 DV 执行一系列 ANOVA 测试,即:

summary(lm(A ~ group, d.1))
summary(lm(B ~ group, d.1))
summary(lm(C ~ group, d.1))

找出组间不同的绩效指标。

我想知道的是:

  1. 这种方法(MANOVA 后跟一系列 ANOVA)是否合理?在我们走这条路之前是否有严格的假设?
  2. 如果是,是否应该对第二步进行某种修正,即针对单个 DV(多重比较)的一系列 ANOVA?什么孩子矫正?
  3. 对于多个 DV 的此类问题,推荐的方法是什么?

编辑 1:更改文本以包含示例代码。

编辑 2:更新了示例。DV 现在是相关的。

编辑 3:这实际上是涉及客观测量的研究中非常常见的情况。设备通常只是吐出一系列措施,即使您没有特别要求它们。例如,您有两组,对照组和患者组,并进行实验室步态分析。步态分析系统为您提供 50 种不同的步态测量。您的研究问题可能是:两组的步态是否相似?如果不是,它们在哪些方面不同?

2个回答

1)这种方法(MANOVA后跟一系列ANOVA)是否合理?在我们走这条路之前是否有严格的假设?

在您提供的示例数据中,A、B 和 C 之间没有相关性。因此,MANOVA 似乎无关紧要。除非您对 A、B 和 C 之间的关系感兴趣,或者有理由认为这三者会以某种方式相关,否则请直接跳到 ANOVA。

2)如果是,是否应该对第二步进行某种校正,即针对单个 DV(多重比较)的一系列 ANOVA?什么样的矫正?

不,可能不会。

3) 对于多 DV 的此类问题,推荐的方法是什么?

好吧,如果您知道它们之间的关系,或者知道它们都会受到例如主题的影响,那么您有两种可能的选择。如果您知道它们之间的关系,请尝试使用 Structural Equation Modeling 之类的方法。如果有一些理由怀疑每个指标都会以同样的方式受到主题的影响,那么您需要对此进行控制。

我可能会建议您查看以下论文,因为它解决了您的大部分问题:HJ Keselman、Carl J. Huberty、Lisa M. Lix、Stephen Olejnik、Robert A. Cribbie、Barbara Donahue、Rhonda K. Kowalchuk、Laureen L. Lowman ,玛莎 D. 佩托斯基、乔安妮 C. 凯塞尔曼和乔尔 R. 莱文。1998. 教育研究人员的统计实践:ANOVA、MANOVA 和 ANCOVA 分析的分析。教育研究回顾。68; 350-386 DOI:10.3102/00346543068003350

答案在于您如何模拟数据。它定义了您假设的随机过程,并启发了您应该如何进行推理。

这个

set.seed(100)
group <- rep(c(0,1), each=40)
A <- rnorm(80, 5, .5) + .1 * group
B <- rnorm(80, 9, .3) + .2 * group + .5 * A
C <- rnorm(80, 12, .3) + .2 * group + .7 * B
d.1 <- data.frame(A = A, B = B, C = C, group = group)

建立多元正态分布。

如果你知道依赖结构并且它是一个有向无环图——比如你的例子,A​​依赖于组,B依赖于A和组,C依赖于B和组——只需进行一系列线性回归并推断组项的系数。

如果依赖结构更复杂,你应该看看结构方程模型

无论哪种方式,最好的方法是写出您的似然函数(它是多元法线的乘积)并弄清楚如何估计链接函数的参数(在这种情况下是线性的)。