解释 glmer 中的随机效应方差

机器算法验证 r 广义线性模型 方差 lme4-nlme 生态
2022-01-31 11:17:33

我正在修改一篇关于授粉的论文,其中数据是二项式分布的(果实成熟与否)。所以我使用glmer了一种随机效应(单个植物)和一种固定效应(治疗)。一位评论者想知道植物是否对坐果有影响——但我无法解释glmer结果。

我在网上阅读过,似乎直接比较glmglmer模型可能存在问题,所以我没有这样做。我认为回答这个问题最直接的方法是将随机效应方差(1.449,如下)与总方差或治疗解释的方差进行比较。但是我如何计算这些其他方差?它们似乎没有包含在下面的输出中。我读到一些关于二项式不包括剩余方差的内容glmer——我如何解释随机效应的相对重要性?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509
4个回答

虽然对于 GLMM原则上可以获得“每种效应解释的比例方差”的类似物,但有几个复杂的因素(您认为模型的哪些级别是“总方差”,以及如何量化由于最低级别 [在这种情况下为二项式] 抽样分布)? Nakagawa 和 Schielzeth (doi:10.1111/j.2041-210x.2012.00261.x) 提出了一种计算 (G)LMM 的 R^2(解释的总方差的比例)的通用方法,该方法在生态学中非常流行;徐等人 2003采取类似的方法。原则上,这种方法可能会扩展到考虑不同术语解释的方差比例[但请注意,以这种方式考虑的模型中所有术语的“方差比例”可能不会达到 100%——它可以或多或少]。

但是,如果您的审阅者不关注统计细节并且对“重要性”的更启发式解释感到满意,您可以指出估计的工厂间标准偏差为 1.20,非常接近最大治疗效果(-1.18);这意味着植物相对于处理效果的大小变化很大(例如,植物效果的 95% 范围约为4σ, 从1.96σ+1.96σ)。

视觉上:

在此处输入图像描述

你想要的是测试的方差是否PlantID0. 然而,这是一个尝试运行的奇怪测试,因为空值位于允许空间的边界。这样的测试仍在运行,但很多人对它们感到非常不舒服。

在您的情况下,每个工厂都有多个测量值,因此一种快速而肮脏的方法是运行具有PlantID固定效应的模型,并测试该效应。

对您的审阅者的简单回答是“是的”。如果他要求您测试随机效应的方差是否与 0 显着不同,您有几个选择。请注意,如果随机效应的方差不同于 0,许多聪明人对测试感到不舒服。

最简单的是似然比检验,尽管大多数人不推荐。在边界处测试时,它们非常保守(即您正在测试尽可能低的方差 0)。有一条经验法则,p 值大约是实际值的两倍。

大多数地方推荐的方法是参数引导。您可以bootMerlme4包装中使用。确保您将 lmer 函数的 REML 参数设置为 FALSE,否则您的方差将大于 0 100% 的时间(或接近它......实际上它可能会大于 0 接近 100%反正时间)。

一些提示和更多资源:

http://glmm.wikidot.com/faq(查找如何测试随机效应是否显着?标题)

lmer() 固定效果的参数引导测试

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/

Multiple-Sample Cochran's Q Test中,他们使用方差分析来比较两个模型的结果(一个没有随机效应,一个有随机效应)。

巴利阿里群岛 Jairo Rocha 大学