我是否应该在 ezANOVA 中包含一个请求类型 III 平方和的参数?

机器算法验证 r 方差分析 平方和
2022-01-28 03:16:23

我为 R 开发了 ez 包,作为帮助人们从 SPSS 等统计包过渡到 R 的一种手段。这(希望)是通过简化各种 ANOVA 的规范并提供类似 SPSS 的输出(包括效果大小和假设)来实现的测试),以及其他功能。ezANOVA()函数主要用作 的包装器car::Anova(),但当前版本ezANOVA()仅实现类型 II 的平方和,而car::Anova()允许指定类型 II 或 -III 的平方和。正如我可能预料到的那样,一些用户要求我在ezANOVA()允许用户请求 type-II 或 type-III。我一直保持沉默,并在下面概述了我的推理,但我希望社区对我或与该问题有关的任何其他推理提出意见。

包括“SS_type”参数的原因ezANOVA()

  1. I、II 和 III 类型和方之间的差异仅在数据不平衡时才会出现,在这种情况下,我会说通过进一步收集数据来改善不平衡比摆弄 ANOVA 计算带来更多好处。
  2. II 型和 III 型之间的差异适用于由高阶效应限定的低阶效应,在这种情况下,我认为低阶效应在科学上是无趣的。(但请参阅下面的参数可能的复杂性)
  3. 对于那些 (1) 和 (2) 不适用的罕见情况(当无法进一步收集数据并且研究人员对我目前无法想象的合格主效应具有有效的科学兴趣时),可以相对容易地修改ezANOVA()源或利用自身car::Anova()来实现 III 型测试。通过这种方式,我认为获得 III 类测试所需的额外努力/理解是我可以确保只有那些真正知道自己在做什么的人才能走这条路的一种手段。

现在,最近的 III 型请求者指出,考虑到存在但“不显着”的高阶效应可能会偏向低阶效应的平方和计算的情况,论证 (2) 被破坏了。在这种情况下,可以想象研究人员会关注高阶效应,并看到它“不显着”,然后转向尝试解释研究人员不知道的低阶效应已经受到损害。我最初的反应是,这不是平方和的问题,而是 p 值和零假设检验的传统问题。我怀疑更明确的证据测量,例如似然比,可能更有可能产生与数据一致的模型的不那么模棱两可的画面。然而,我没有

4个回答

只是为了放大-我相信我是最近的请求者。

在具体评论迈克的观点:

  1. 显然,I/II/III 差异仅适用于相关预测变量(其中不平衡设计是最常见的例子,当然在阶乘方差分析中) - 但在我看来,这似乎是一个驳斥不平衡情况分析的论点(因此任何类型的 I/II/III 辩论)。它可能不完美,但事情就是这样发生的(在许多情况下,进一步收集数据的成本超过了统计问题,尽管有警告)。

  2. 这是完全公平的,代表了我遇到的大多数“II 与 III,支持 II”论点的实质。我遇到的最好的总结是 Langsrud (2003) “ANOVA for unbalanced data: Use Type II instead of Type III sum of squares”,Statistics and Computing 13: 163-167(如果原件很难找到,我有一个 PDF )。他认为(以双因素情况为基本示例)如果存在交互作用,则存在交互作用,因此考虑主效应通常是没有意义的(显然是公平的)——如果没有交互作用,则类型 II 分析主效应比 Type III 更强大(毫无疑问),所以你应该总是选择 Type II。我见过其他论点(例如 Venables,

  3. 我同意这一点:如果你有互动但对主要影响也有一些疑问,那么你可能进入了自己动手的领域。

显然,有些人只想要类型 III,因为 SPSS 做到了,或者其他一些对统计高级权威的引用。我并不完全反对这种观点,如果归结为很多人坚持使用 SPSS(我有一些反对,即时间、金钱和许可证到期条件)和 III 型 SS 或很多人的选择人们转向 R 和 III 型 SS。然而,这个论点在统计上显然是蹩脚的。

然而,我发现支持类型 III 的论点更为重要的是 Myers & Well (2003, "Research Design and Statistical Analysis", pp. 323, 626-629) 和 Maxwell & Delaney (2004, "设计实验和分析数据:模型比较视角”,第 324-328、332-335 页)。即如下:

  • 如果存在交互,则所有方法对交互平方和给出相同的结果
  • 类型 II 假设其主效应检验没有交互作用;III型没有
  • 一些人(例如 Langsrud)争辩说,如果交互作用不显着,那么您有理由假设不存在交互作用,并查看(更强大的)II 型主效应
  • 但是,如果交互作用的检验力不足,但存在交互作用,则交互作用可能会“不显着”,但仍会导致违反 II 型主效应检验的假设,从而使这些检验偏向于过于宽松.
  • Myers & Well 引用 Appelbaum/Cramer 作为 II 型方法的主要支持者,并继续 [p323]:“...... 可以使用更保守的交互不显着标准,例如要求交互在.25 水平,但对这种方法的后果的理解不足。作为一般规则,不应计算类型 II 平方和,除非有很强的先验理由假设没有交互作用,并且明显不显着的交互作用平方和。” 他们引用 [p629] 总体而言,Lee & Hornick 1981 证明了不接近显着性的交互作用可能会使主效应的检验产生偏差。Maxwell & Delaney [p334] 如果总体交互作用为零,则提倡使用 II 型方法,因为功率,和类型 III 方法,如果它不是 [为了从这种方法派生的手段的可解释性]。他们也提倡在现实生活中使用类型 III(当你从数据中推断是否存在交互时),因为在交互测试中会出现类型 2 [动力不足] 错误并因此意外违反的问题II 型 SS 方法的假设;然后他们对 Myers & Well 提出了类似的进一步观点,并注意关于这个问题的长期辩论!从数据中重新推断是否存在交互),因为在交互测试中会出现类型 2 [功率不足] 错误并因此意外违反 II 型 SS 方法的假设;然后他们对 Myers & Well 提出了类似的进一步观点,并注意关于这个问题的长期辩论!从数据中重新推断是否存在交互),因为在交互测试中会出现类型 2 [功率不足] 错误并因此意外违反 II 型 SS 方法的假设;然后他们对 Myers & Well 提出了类似的进一步观点,并注意关于这个问题的长期辩论!

所以我的解释(我不是专家!)是争论的双方都有很多更高的统计权威。提出的通常论点不是关于会引起问题的通常情况(这种情况是解释具有非显着相互作用的主要影响的常见情况);并且有合理的理由担心在这种情况下的第二类方法(归结为权力与潜在的过度自由主义的事情)。

对我来说,希望 ezANOVA 中的 Type III 选项以及 Type II 就足够了,因为(以我的钱)它是 R 的 ANOVA 系统的极好接口。在我看来,R 对于新手来说很容易使用,而“ez”包,带有 ezANOVA 和相当可爱的效果绘图功能,在使 R 更容易被更广泛的研究受众访问方面大有帮助。我正在进行的一些想法(以及对 ezANOVA 的一个讨厌的 hack)位于http://www.psychol.cam.ac.uk/statistics/R/anova.html

很想听听大家的想法!

警告:纯粹的非统计答案。在进行相同类型的分析(例如,ANOVA)时,我更喜欢使用一个函数(或至少一个包)。到目前为止,我一直使用Anova()它,因为我更喜欢它的语法来指定具有重复测量的模型 - 与 相比aov(),并且在非重复测量时损失很小(SS 类型 I)。ezANOVA()对于效果大小的额外好处是很好的。但我不特别喜欢的是必须处理 3 个不同的函数来执行基本相同类型的分析,只是因为其中一个实现了特性 X(但不是 Y),而另一个实现了特性 Y(但不是 X)。

对于 ANOVA,我可以在oneway()lm()aov()Anova()ezANOVA()以及可能的其他值之间进行选择。在教授 R 时,解释不同的选项、它们如何相互关联(aov()是 的包装器lm())以及哪个函数做什么已经很痛苦:

  • oneway()仅适用于单因素设计,但有选项var.equal=FALSE在和其他中没有这样的选项aov(),但这些功能也适用于多因素设计。
  • 重复测量的语法有点复杂aov(),更好Anova()
  • 方便的 SS 类型 I 只在aov(), 不在Anova()
  • 方便的 SS 类型 II 和 III 仅在Anova(), 不在aov()
  • 方便的效应量在其他方面衡量ezANOVA(),而不是在其他方面

只需要用一种一致的语法来教一个函数就可以了。没有方便的 SS 类型 III,ezANOVA()对我来说不可能是那个功能,因为我知道学生会在某个时候被要求使用它们(“只需交叉检查 John Doe 使用 SPSS 获得的这些结果”)。我觉得最好选择自己做出选择,而不必学习另一种指定模型的语法。“我知道什么对你最好”的态度可能有其优点,但可能会过度保护。

R 世界不太喜欢 3 型 SS。

通常引用的参考资料之一是Bill Venables (2000) 的“Exegeses on Linear Models”

我希望我没有误导他,但我认为他的主要论点是 Type 3 SS 违反了线性模型的边际原则,因此是不合理的。

对我来说,这是一场关于 II/III 类问题的大开眼界的辩论。感谢大家提供讨论的努力。我会同意将 II 型持续提升到 III 型的观点,但对这个论点的把握很弱——我只是依赖于约翰·福克斯的回归书(汽车)中的建议,即很少有 III 型测试可解释的(嗯,我认为他是这么说的......)。

无论如何 - ezANOVA 对于允许访问 R 功能非常有用,否则我教心理学的本科生将无法访问这些功能。我提供在线 R 模块,一个以 ezANOVA 为特色的模块来演示混合 ANOVA 设计(尽管看起来之前的版本 3 可能对此有问题...... doh!)

在这里尝试一下:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

模块加载后(约 10 秒)找到计算按钮(页面的一半),它将运行 ezANOVA 和相关的表格和绘图。

伊恩