如何在线性混合效应模型(lmer vs glmer)中获得 z 值而不是 t 值?

机器算法验证 假设检验 混合模式 lme4-nlme t分布 z 统计量
2022-04-15 10:13:51

我想知道为什么在我的lmer模型中summary()只产生 t 值而不是 z 值,例如这里:

model <- lmer(area~Register+(1|subject), data = ev)
summary(model)

Linear mixed model fit by REML 
t-tests use  Satterthwaite approximations to degrees of freedom ['lmerMod']
Formula: area ~ Register + (1 | subject)
   Data: ev

REML criterion at convergence: 166.3

Scaled residuals: 
     Min       1Q   Median       3Q      Max 
-1.60697 -0.46989  0.06558  0.69561  1.41818 

Random effects:
 Groups   Name        Variance Std.Dev.
 subject  (Intercept) 1.185    1.089   
 Residual             1.747    1.322   
Number of obs: 45, groups:  subject, 15

Fixed effects:
                        Estimate Std. Error      df t value Pr(>|t|)    
(Intercept)              11.2827     0.4421 31.6600  25.522  < 2e-16 ***
RegisterIDS               1.2339     0.4826 28.0000   2.557  0.01627 *  
RegisterLombard\nSpeech   1.3630     0.4826 28.0000   2.824  0.00863 ** 
---
Signif. codes:  0 ?**?0.001 ?*?0.01 ??0.05 ??0.1 ??1

Correlation of Fixed Effects:
            (Intr) RgsIDS
RegisterIDS -0.546       
RgstrLmbrdS -0.546  0.500

我想知道在什么情况下 R 会报告 z 值?我在一些论文中看到人们获得了具有二项式相关值的 z 值,这是 z 值出现的唯一情况吗?

1个回答

tl;dr lmer(线性混合模型)将此列标记为“t 统计量”,而glmer(广义线性混合模型)将其标记为“Z 统计量”,但它们实际上是相同的数字。这反映了它们的输出方式lmglm报告方式之间的差异。

报告的“t 统计量” lmer(假设观测值的高斯分布以固定和随机效应为条件)和报告的“Z 统计量” glmer(假设二项式、泊松等......分布......)实际上是相同的数字,即点估计值除以其标准误差的估计值(您可以通过 进行检查cc <- coef(summary(fitted_model)); cc[,"Estimate"]/cc[,"Std. Error"])。在标准最小二乘拟合中,我们可以证明这个量是t-分布,我们可以准确地推导出相应的自由度。我们也可以对一些线性混合模型(即仅具有单一或嵌套随机效应的平衡设计)执行此操作。对于更复杂的线性混合模型,有各种近似值(Satterthwaite,Kenward-Roger;参见pbkrtestlmerTest包)用于推导x¯/σ^.

对于广义线性模型,有限尺寸的校正不太好理解和传播;的抽样分布x¯/σ^即使在简单的情况下,非正态响应也不是t 分布的(它也不是 Z 分布的,除了渐近)。在Bartlett 校正的标题下,有一些关于近似有限尺寸校正的文献,但 GLM 中的标准做法是将这些值报告为“Z 统计量”并假设(在计算 p 值时)人们知道他们在假设样本量很大。