简短版本:
1) 是否有任何已发表的对将用于 GLMM 的批评,特别是Nakagawa & Schielzeth (2013)的流行方法 from generalized linear mixed-effects models
2)大多数读者是否会从中受益,或者该统计数据的复杂性是否使它们不是很有用?
长版:使用Nakagawa & Schielzeth (2013)的方法 报告已变得非常流行(截至 2017 年春季引用 1774)。他们提出了一种计算与固定效应相关与随机效应无关)和整个模型的 R^2(以随机效应为条件)。
然而,对于计算的复杂性以及定义它时出现的矛盾,特别是来自 lme4 开发人员 Doug Bates 进行了重要的讨论。(请参阅此处获取粘贴到简历回复中的 Bates 引用,以及此处查看列表服务中的回复。这些问题也在GLMM wiki中进行了审查)。尽管进行了一般性讨论,但我不知道对 Nakagawa & Schielzeth (2013) 有任何特别的批评。
一位审阅者要求我报告一些分层模型的边际值。然而,我认为主要是在建模时查看的有用诊断,但对读者的价值有限 - 或者更糟糕的是,甚至可能会产生误导。特别是我不愿意为我的 GLMM 报告,因为随机效应(R2.M)边缘的固定效应值很小(<0.10),因为我的随机效应水平之间存在大量变化( R2.M 的定义见下文)。从所有其他方面来看,我对模型很满意,我认为不会为读者提供相关信息;数据将被公布,任何人都想自己计算。
我认为我论文的大多数读者在查看这些数字时会对低的主要原因,我担心我的结果会因为这些小而打折。和模型“重要性”的其他度量之间的紧张关系由 Nakagawa & Schielzeth (2013) 简要提及,但没有深入研究;请参阅下面他们论文中的示例;这里在 CV 上描述了一种有点类似的情况,尽管在这种情况下,较低且参数不重要)。
正如我所看到的,固定效应的低边际和整体模型的高条件只是告诉我,在我的模型中代表的时间、个人和地点之间存在很多差异。同样,如果这是一个阻塞实验,低边际和高条件会告诉我阻塞是一个好主意并且完成了它的工作。
因此,我的问题是 1) 是否有任何已发表的对 Nakagawa & Schielzeth (2013) 或类似方法的批评,以及 2) 回应审稿人的最原则性方法是什么。
为了回复评论,我看到我的选项如下(不相互排斥):
- 添加到论文中,然后根据我的随机效应的方差量解释如何解释它们。
- 将仅截距模型中的 AIC 添加到论文中作为拟合度量。讨论(至少对编辑)AIC 表明尽管较低,但通过包含固定效应来改进模型。
- 向编辑/审阅者证明我目前的方法(p 值、CI、效应大小、模型预测与原始数据的图)是足够的,并为他们提供 Bates 和其他人关于 R2 限制的评论的链接。 GLMM,以及的一般问题(即,在CV 上)。
下面我更精确地为 GLMM 定义 ,并展示了原始 Nakagawa & Schielzeth (2013) 中低边际
示例:Nakagawa & Schielzeth (2013) 的二项式模型中的
边际定义为
R2.GLMM.M = (var.f)/(var.f + var.random.effects + var.residual + var.dist)
其中 var.f 是拟合模型的预测方差,var.dist 是特定于不同 GLM 分布的术语。
Conditional (R2.GLMM.C) 定义类似,只是将随机效应的方差加到分母上,得到模型解释的总体方差比例。
N&S 分析模拟二项式和泊松数据,以检查栖息地和假设治疗对甲虫生物学的影响;他们报告相对较低的 R2.M 分别为 0.077 和 0.0976(结果转载如下)。然后他们注意到:
“与 R2.GLMM.C 值相比,R2.GLMM.M 值 [由固定效应解释的方差] 相对较小 (8-10%) ...[但是] 重要的是要注意处理和栖息地 [固定]影响具有统计学意义……然而,大部分数据变异性与残差一起存在于随机效应中……请注意,R2.GLMM.M 和 R2.GLMM.C 值之间的差异反映了在“
我同意他们的观点,即研究人员可以获得“对数据集的额外洞察力”,但不确定读者是否会理解该结果的复杂性,即“大部分数据可变性......存在于随机效应中”。
library(lme4); library(rptR); library(piecewiseSEM)
data(BeetlesMale)
#Null model
m0 <- glmer(Colour ~ 1 + (1|Population) + (1|Container),
family = "binomial", data = BeetlesMale)
#Full model
mF <- update(m0, . ~ . + Treatment + Habitat)
#R2.GLMM
sem.model.fits(list(m0,mF))[,c(5:8)]
Marginal Conditional AIC dAIC
1 0.0000 0.223 602 29.2
2 0.0777 0.311 573 0.0