线性混合效应模型

机器算法验证 混合模式
2022-01-24 00:58:32

我经常听说 LME 模型在分析准确性数据(即在心理学实验中)时更可靠,因为它们可以处理传统方法(例如 ANOVA)无法处理的二项式和其他非正态分布。

LME 模型允许它们合并这些其他分布的数学基础是什么,以及描述这一点的一些不太技术性的论文是什么?

3个回答

混合效应模型的一个主要好处是它们不假设观察之间是独立的,并且在一个单元或集群中可以存在相关的观察。

这在第 10 章“随机效应和混合效应”的第一部分的“现代应用统计与 S”(MASS)中有简要介绍。V&R 在该部分中通过汽油数据比较了 ANOVA 和 lme 的示例,因此这是一个很好的概述。lme要在nlme中使用的 R 函数。

模型公式基于 Laird and Ware (1982),因此您可以将其作为主要来源,尽管它肯定不适合介绍。

  • Laird, NM and Ware, JH (1982) “纵向数据的随机效应模型”,生物统计学,38, 963–974。
  • Venables, WN 和 Ripley, BD (2002) “现代应用统计与 S ”,第 4 版,Springer-Verlag。

您还可以查看John Fox 的“An R and S-PLUS Companion to Applied Regression”的“线性混合模型” (PDF) 附录。Roger Levy 的本次讲座( PDF) 讨论了多元正态分布的混合效应模型。

一篇很好的文章解释了 LMM 的一般方法及其相对于 ANOVA 的优势:

线性混合效应模型 (LMM) 将回归模型概括为在例如人或物品的水平上具有类似残差的成分、随机效应,而不仅仅是在个体观察的水平上。这些模型非常灵活,例如允许对不同的斜率和截距进行建模。

LMM 通过使用某种似然函数、给定某个参数的数据的概率以及通过摆弄参数来最大化这一点的方法(最大似然估计;MLE)来工作。MLE 是一种非常通用的技术,允许将许多不同的模型(例如二进制和计数数据的模型)拟合到数据中,并在许多地方进行了解释,例如,

  • Agresti, A. (2007)。分类数据分析简介(第 2 版)约翰威利父子公司。

然而,LMM 无法处理二进制数据或计数等非高斯数据。为此,您需要广义线性混合效应模型 (GLMM)。理解这些的一种方法是首先研究 GLM。另见 Agresti (2007)。

LME 在分析准确性数据方面的主要优势是能够解释一系列随机效应。在心理学实验中,研究人员通常会汇总项目和/或参与者。不仅人彼此不同,而且项目也不同(例如,有些词可能更独特或更容易记住)。忽略这些可变性来源通常会导致对准确性的低估(例如较低的 d' 值)。虽然参与者聚合问题可以通过个人估计以某种方式处理,但项目效应仍然存在,并且通常大于参与者效应。LME 不仅允许您同时处理这两种随机效应,还可以向它们添加特定的附加预测变量(年龄、教育水平、字长等)。

LME 的一个非常好的参考,特别是在语言学和实验心理学领域,是 Analyzing Linguistic Data: A Practical Introduction to Statistics using R

干杯