具有效果编码的广义线性模型的参数有什么解释?

机器算法验证 r 二项分布 罗吉特 lme4-nlme
2022-03-10 05:13:54
library(lme4)
    out <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.sum"))

summary(out)
Fixed effects:
            Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.32337    0.22129 -10.499  < 2e-16 ***
period1      0.92498    0.18330   5.046 4.51e-07 ***
period2     -0.06698    0.22845  -0.293    0.769
period3     -0.20326    0.24193  -0.840    0.401

我从来没有遇到过需要使用效果编码(contr.sum针对R用户)来拟合广义线性模型的情况。我可以应用与线性模型案例相同的解释吗?在正态线性模型中,截距将是总均值和 s(参数,和影响即因子水平如何偏离总均值。βperiod1period2period3period4 = (Intercept) - period1 - period2 - period3

这就是我认为广义线性模型的类似解释的方式。(我将对所有参数取幂,从而将对数赔率(-ratios)转换为赔率(-ratios)。)截距将是成功与失败的总体几率(在这里坚持经典的二项式术语)和 s log-odds-ratios例如,我们通过添加然后取幂:得到几率真的是整体/中等赔率 sexp((Intercept))βperiod1(Intercept)+period1exp((Intercept)+period1)(Intercept)β赔率比

1个回答

在效果编码下,汇总表 summary(out) 中的截距是您的案例中所有四个时期的平均 logit(log-odds 或优势比对数),而其他每个效果都是 logit 的差异相对于平均 logit 的相应时期。

您可以通过将当前结果与不同的编码方法(例如数据上的虚拟编码)进行比较来轻松验证您的解释:

out2 <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.treatment"))

summary(out2)