如何解释 I 型、II 型和 III 型 ANOVA 和 MANOVA?

机器算法验证 r 假设检验 方差分析 马诺瓦 平方和
2022-01-21 03:26:21

我的主要问题是在进行 I 型(顺序)ANOVA 时如何解释输出(系数、F、P)?

我的具体研究问题有点复杂,所以我将把我的例子分成几部分。首先,如果我对蜘蛛密度 (X1) 对植物生长 (Y1) 的影响感兴趣,并且我在围栏中种植幼苗并操纵蜘蛛密度,那么我可以使用简单的 ANOVA 或线性回归分析数据。那么我是否使用类型 I、II 或 III 平方和 (SS) 来进行 ANOVA 也没关系。就我而言,我有 5 个密度级别的 4 个重复,因此我可以将密度用作一个因素或作为一个连续变量。在这种情况下,我更愿意将其解释为一个连续的独立(预测)变量。在 RI 中可能会运行以下命令:

lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)

希望运行 anova 函数以便稍后进行比较,所以请忽略它的奇怪之处。输出是:

Response: y1
          Df  Sum Sq Mean Sq F value  Pr(>F)  
density    1 0.48357 0.48357  3.4279 0.08058 .
Residuals 18 2.53920 0.14107 

现在,假设我怀疑我无法控制的土壤中无机氮的起始水平也可能显着影响植物的生长。我对这种影响不是特别感兴趣,但想潜在地解释它引起的变化。真的,我的主要兴趣是蜘蛛密度的影响(假设:蜘蛛密度增加会导致植物生长增加 - 大概是通过减少食草昆虫,但我只是在测试效果而不是机制)。我可以将无机氮的影响添加到我的分析中。

为了我的问题,让我们假设我测试了交互密度*无机 N 并且它不显着,所以我将其从分析中删除并运行以下主要效果:

> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table

Response: y1
           Df  Sum Sq Mean Sq F value  Pr(>F)  
density     1 0.48357 0.48357  3.4113 0.08223 .
inorganicN  1 0.12936 0.12936  0.9126 0.35282  
Residuals  17 2.40983 0.14175 

现在,我使用 I 型还是 II 型 SS 会有所不同(我知道有些人反对 I 型和 II 型等术语,但鉴于 SAS 的流行,它很容易简称)。R anova{stats} 默认使用 Type I。我可以通过颠倒我的主效应的顺序来计算密度的 II 型 SS、F 和 P,或者我可以使用 John Fox 博士的“汽车”包(应用回归的伴侣)。我更喜欢后一种方法,因为它更容易解决更复杂的问题。

library(car)
Anova(lm2)
            Sum Sq Df F value  Pr(>F)  
density    0.58425  1  4.1216 0.05829 .
inorganicN 0.12936  1  0.9126 0.35282  
Residuals  2.40983 17  

我的理解是,II 型假设是,“考虑到(保持常数?)x2 的影响,x1 对 y1 没有线性影响”,对于给定 x1 的 x2 也是如此。我想这就是我感到困惑的地方。与使用 II 型方法的假设相比,ANOVA 使用上述 I 型(顺序)方法检验的假设是什么?

实际上,我的数据要复杂一些,因为我测量了许多植物生长指标以及养分动态和枯枝落叶分解。我的实际分析是这样的:

Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)

Type II MANOVA Tests: Pillai test statistic
        Df test stat approx F num Df den Df  Pr(>F)    
density  1   0.34397        1      5     12 0.34269    
nitrate  1   0.99994    40337      5     12 < 2e-16 ***
Npred    1   0.65582        5      5     12 0.01445 * 


# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)

          Df  Pillai approx F num Df den Df  Pr(>F)    
density    1 0.99950     4762      5     12 < 2e-16 ***
nitrate    1 0.99995    46248      5     12 < 2e-16 ***
Npred      1 0.65582        5      5     12 0.01445 *  
Residuals 16                                           
1个回答

你所说的 II 型 SS,我称之为 III 型 SS。让我们假设只有两个因素 A 和 B(我们稍后会加入 A*B 交互来区分 II 型 SS)。此外,假设在四个单元格 =11、 =9、 =9 和 =11)。现在您的两个因素相互关联。(自己尝试一下,制作 2 列 1 和 0 并将它们关联起来,是否“显着”并不重要,这是您关心的全部人口)。您的因素相关的问题是存在与两者相关的平方和nn11n12n21n22r=.1rA 和 B。在计算 ANOVA(或任何其他线性回归)时,我们希望对平方和进行分区。分区将所有平方和归为一个且只有一个的几个子集。(例如,我们可能希望将 SS 划分为 A、B 和错误。)但是,由于您的因素(这里仍然只有 A 和 B)不是正交的,因此这些 SS 没有唯一的划分。事实上,可以有很多分区,如果你愿意将你的 SS 分割成分数(例如,“我将把 0.5 放入这个箱子,将 0.5 放入那个箱子”),那么就有无限的分区。一种形象化的方法是想象万事达卡符号:矩形代表总 SS,每个圆圈代表可归因于该因素的 SS,但请注意中心圆圈之间的重叠,可以给出那些 SS到任一圈。

在此处输入图像描述

问题是:我们如何从所有这些可能性中选择“正确”的分区?让我们重新引入交互并讨论一些可能性:

I型SS:

  • 党卫军(甲)
  • 党卫军(B|A)
  • SS(A*B|A,B)

II型不锈钢:

  • 党卫军(A|B)
  • 党卫军(B|A)
  • SS(A*B|A,B)

III型不锈钢:

  • SS(A|B,A*B)
  • SS(B|A,A*B)
  • SS(A*B|A,B)

注意这些不同的可能性是如何工作的。只有 I 型 SS 实际上在 MasterCard 符号中圆圈之间的重叠部分使用那些 SS。也就是说,可以归因于 A 或 B 的SS 在您使用 I 型 SS(特别是您首先输入模型的那个)时实际上归因于其中一个在其他两种方法中,根本不使用重叠SS因此,I 型 SS 将所有可归因于 A 的 SS(包括那些也可归因于其他地方的 SS)给 A,然后将所有可归因于 B 的剩余SS 给 B,然后将所有的 A*B 交互都给剩下SS 可归因于 A*B,并将无法归因于任何东西的剩余部分留给错误项。

III 型 SS 只给 A 那些唯一归属于 A 的 SS,同样它只给 B 和交互那些唯一归属于它们的 SS。错误项只获取那些不能归因于任何因素的 SS。因此,不使用那些可归因于 2 个或更多可能性的“模棱两可”的 SS。如果您在 ANOVA 表中对 III 型 SS 求和,您会注意到它们不等于总 SS。换句话说,这种分析肯定是错误的,但以一种认知保守的方式犯了错误。许多统计学家发现这种方法令人震惊,但是政府资助机构(我相信 FDA)要求使用它们。

II 型方法旨在捕捉 III 型背后的想法可能有价值的地方,但要减轻其过度行为。具体来说,它只是为彼此调整 A 和 B 的 SS,而不是交互。然而,实际上 II 型 SS 基本上从未使用过。您需要了解所有这些,并且对您的软件有足够的了解才能获得这些估计,而通常认为这是胡说八道的分析师。

SS的类型更多(我相信IV和V)。他们在 60 年代后期被建议用于处理某些情况,但后来表明他们并没有按照人们的想法去做。因此,在这一点上,它们只是一个历史脚注。

至于这些在回答什么问题,你基本上已经在你的问题中拥有了这个权利:

  • 使用 I 型 SS 的估计告诉你有多少 Y 的可变性可以用 A 解释,多少剩余可变性可以用 B 解释,有多少剩余剩余可变性可以用交互作用解释,等等,按顺序
  • 基于 III 型 SS 的估计告诉您在考虑其他所有因素,A 可以解释多少 Y 的剩余变异性,以及在考虑其他所有因素,B 可以解释多少 Y 的剩余变异性以及,等等。(请注意,两者同时进行;如果这对您有意义,并且准确地反映了您的研究问题,则使用 III 型 SS。)