在 R 中检查假设 lmer/lme 混合模型

机器算法验证 r 混合模式 假设 lme4-nlme
2022-01-28 00:10:05

我进行了重复设计,在三个不同的任务中测试了 30 名男性和 30 名女性。我想了解男性和女性的行为有何不同,以及这如何取决于任务。我同时使用了 lmer 和 lme4 包来调查这个问题,但是,我坚持尝试检查这两种方法的假设。我运行的代码是

lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)

我通过将交互与没有交互并运行方差分析的更简单模型进行比较来检查交互是否是最佳模型:

lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)

Q1:可以在线性混合模型中使用这些分类预测变量吗?
Q2:我是否正确理解结果变量(“行为”)本身不需要正态分布(跨性别/任务)?
Q3:如何检查方差的同质性?对于我使用的简单线性模型plot(LM$fitted.values,rstandard(LM))使用plot(reside(lm.base1))够吗?
Q4:检查是否正常使用以下代码好吗?

hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)
4个回答

Q1:是的——就像任何回归模型一样。

Q2:就像一般线性模型一样,您的结果变量不需要作为单变量变量进行正态分布。然而,LME 模型假设模型的残差是正态分布的。因此,对模型进行转换或添加权重将是解决此问题的一种方法(当然,还要检查诊断图)。

问题 3:plot(myModel.lme)

qqnorm(myModel.lme, ~ranef(., level=2))问题4:。此代码将允许您为每个级别的随机效应制作 QQ 图。LME 模型假设不仅集群内的残差是正态分布的,而且每个级别的随机效应也是如此。level从 0、1 到 2变化,以便您可以检查大鼠、任务和主体内残差。

编辑:我还应该补充一点,虽然假设正态性并且转换可能有助于减少非正态错误/随机效应的问题,但尚不清楚所有问题是否都已实际解决或没有引入偏差。如果您的数据需要转换,请谨慎估计随机效应。这是一篇解决这个问题的论文。

您似乎对围绕多级模型的假设具有误导性。没有数据方差同质性的假设,只是残差应该近似正态分布。并且分类预测变量一直用于回归(R 中运行 ANOVA 的基础函数是线性回归命令)。

有关检查假设的详细信息,请查看 Pinheiro 和 Bates 的书(第 174 页,第 4.3.1 节)。此外,如果您打算使用 lme4(本书没有写到),您可以使用带有lmer模型的 plot ( ?plot.merMod) 来复制他们的情节。

为了快速检查正常性,它只是qqnorm(resid(myModel)).

关于第二季度:

根据 Pinheiro 和 Bates 的,您可以使用以下方法:

“该lme函数允许通过参数对误差内组的异方差性进行建模weights。该主题将在第 5.2 节中详细介绍,但现在,知道 varIdent方差函数结构允许每个级别的方差有不同的方差就足够了。一个因子,可用于拟合异方差模型 [...]”

皮涅罗和贝茨,p。177

如果您想检查您之间的相等差异,sex可以使用这种方法:

plot( lm.base2, resid(., type = "p") ~ fitted(.) | sex,
  id = 0.05, adj = -0.3 )

如果方差不同,您可以通过以下方式更新模型:

lm.base2u <- update( lm.base2, weights = varIdent(form = ~ 1 | sex) )
summary(lm.base2u)

此外,您可以查看robustlmm也使用称重方法的包装。Koller关于这个概念的博士论文可作为开放访问获得(“线性混合模型的稳健估计”)。摘要指出:

“开发了一种新的尺度估计,即设计自适应尺度估计,旨在为后续稳健测试提供良好的基础。它通过均衡残差的自然异方差性并调整尺度本身的稳健估计方程来实现. 这些设计自适应校正在小样本设置中至关重要,其中观察的数量可能只是要估计的参数数量的五倍或更少。”



我没有足够的积分来发表评论。但是,我认为有必要澄清上面@John 答案的某些方面。Pinheiro 和 Bates 在 p. 174:

假设 1 - 组内误差是独立的且同正态分布,均值为 0,方差为 σ2,并且它们与随机效应无关。

这种说法确实不清楚同质方差,而且我对统计的深入了解也不足以了解 LME 概念背后的所有数学。然而,在第。175, §4.3.1,处理假设 1的部分他们写道:

在本节中,我们专注于评估组内误差呈正态分布、以零为中心且具有恒定方差的假设的方法。

此外,在以下示例中,“恒定方差”确实很重要。因此,当他们在 p 上写“同正态分布”时,可以推测它们是否暗示同质方差。174 没有更直接地解决它。

Q1:是的,为什么不呢?

Q2:我认为要求是错误是正态分布的。

Q3:例如可以用Leven's test 进行测试。