如何解释广义线性混合模型中随机效应的方差

机器算法验证 r lme4-nlme
2022-02-28 22:03:38

在逻辑广义线性混合模型(族=二项式)中,我不知道如何解释随机效应方差:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

我如何解释这个数值结果?

我有一个多中心研究中的肾移植患者样本。我正在测试患者接受特定抗高血压治疗的概率在各中心之间是否相同。不同中心接受治疗的患者比例差异很大,但可能是由于患者基础特征的差异。所以我估计了一个广义线性混合模型(逻辑),调整了患者的主要特征。这是结果:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

定量变量居中。我知道截距的医院间标准差为 0.6554,以对数赔率表示。因为截距为 -1.804469,在对数比值标度中,因此对于“平均”中心,接受平均年龄男性抗高血压药物治疗的概率为 14.1%,所有变量和免疫治疗 A 的平均值为. 现在开始解释:在随机效应服从正态分布的假设下,我们预计大约 95% 的中心的值在均值零的 2 个标准差内,因此对于普通人来说,接受治疗的概率中心之间会有所不同,覆盖间隔为:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

它是否正确?

此外,如果中心之间的变异性具有统计学意义,我如何在 glmer 中进行测试?我曾经使用 MIXNO,这是 Donald Hedeker 的一个优秀软件,我有一个估计方差的标准误差,这是我在 glmer 中没有的。我怎样才能在置信区间内为每个中心的“普通”人接受治疗?

谢谢

1个回答

如果您向我们展示有关您的模型的更多信息,这可能最有帮助,但是:无论您的反应是什么(例如死亡率),对数几率的基线值因医院而异。基线值(每个医院的截距项)是基线类别(例如“未治疗”)中死亡率(或其他)的对数几率,在任何连续预测变量的值为零时。假设该变化在对数赔率尺度上呈正态分布。截距的院间标准差为0.6554;方差(只是标准偏差的平方——不是标准偏差不确定性的度量)是0.65542=0.4295

(如果您澄清您的问题/添加有关您的模型的更多详细信息,我可以尝试说更多。)

更新:您对变化的解释似乎是正确的。更确切地说,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

应该为您提供基线(男性/平均年龄/等)个体在医院接受治疗的概率的 95% 区间(不是真正的置信区间,但非常相似)。

为了测试随机效应的显着性,您有多种选择(有关更多信息,请参见http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html)。(请注意,RE 方差的标准误差通常不是检验显着性的可靠方法,因为抽样分布通常是偏斜/非正态的。)最简单的方法是进行似然比检验,例如

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

最后除以 2 修正了当空值(即 RE 方差=0)在可行空间的边界上(即 RE 方差不能<0)时似然比检验是保守的事实。