从混合效应模型中提取案例的斜率 (lme4)

机器算法验证 r 混合模式
2022-01-18 00:45:14

我想提取混合效应模型中每个人的斜率,如下一段所述

混合效应模型用于表征认知总结测量中的个体变化路径,包括作为固定效应的年龄、性别和教育年限(Laird and Ware, 1982; Wilson et al., 2000, 2002c)... . 在对年龄、性别和教育的影响进行调整后,从混合模型中提取了残余的个体认知下降斜率项。然后将特定于人的调整残差斜率用作遗传关联分析的定量结果表型。这些估计值等于个人斜率与相同年龄、性别和教育水平的个人的预测斜率之间的差异。

De Jager, PL, Shulman, JM, Chibnik, LB, Keenan, BT, Raj, T., Wilson, RS 等。(2012)。对影响与年龄相关的认知衰退率的常见变异进行全基因组扫描衰老的神经生物学,33(5),1017.e1–1017.e15。

我已经研究过使用该coef函数来提取每个人的系数,但我不确定这是否是正确的使用方法。

任何人都可以就如何做到这一点提供一些建议吗?

#example R code 
library(lme4)
attach(sleepstudy)  
fml <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)
beta <- coef(fml)$Subject
colnames(beta) <- c("Intercept", "Slope")
beta

summary(beta)
summary(fm1)
1个回答

该模型:

library(lme4)
data(sleepstudy)
fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)

该函数coef是提取个体差异的正确方法。

> coef(fm1)$Subject
    (Intercept)       Days
308    253.6637 19.6662581
309    211.0065  1.8475834
310    212.4449  5.0184067
330    275.0956  5.6529540
331    273.6653  7.3973908
332    260.4446 10.1951151
333    268.2455 10.2436611
334    244.1725 11.5418622
335    251.0714 -0.2848735
337    286.2955 19.0955694
349    226.1950 11.6407008
350    238.3351 17.0814915
351    255.9829  7.4520286
352    272.2687 14.0032989
369    254.6806 11.3395025
370    225.7922 15.2897513
371    252.2121  9.4791308
372    263.7196 11.7513155

这些值是固定效应和方差分量(随机效应)的组合。您可以使用summarycoef来获得固定效应的系数。

> coef(summary(fm1))[ , "Estimate"]
(Intercept)        Days 
  251.40510    10.46729 

截距为 251.4,斜率(与 相关Days)为 10.4。这些系数是所有科目的平均值。要获得随机效果,您可以使用ranef.

> ranef(fm1)$Subject
    (Intercept)        Days
308   2.2585637   9.1989722
309 -40.3985802  -8.6197026
310 -38.9602496  -5.4488792
330  23.6905025  -4.8143320
331  22.2602062  -3.0698952
332   9.0395271  -0.2721709
333  16.8404333  -0.2236248
334  -7.2325803   1.0745763
335  -0.3336936 -10.7521594
337  34.8903534   8.6282835
349 -25.2101138   1.1734148
350 -13.0699598   6.6142055
351   4.5778364  -3.0152574
352  20.8635944   3.5360130
369   3.2754532   0.8722166
370 -25.6128737   4.8224653
371   0.8070401  -0.9881551
372  12.3145406   1.2840295

这些值是受试者的方差分量。每行对应一个主题。本质上,每列的平均值为零,因为这些值对应于与固定效应相关的差异。

> colMeans(ranef(fm1)$Subject)
  (Intercept)          Days 
 4.092529e-13 -2.000283e-13 

请注意,这些值等于零,偏差是由于浮点数表示的不精确造成的。

的结果是coef(fm1)$Subject将固定效应纳入随机效应,即在随机效应中加入固定效应系数。结果是单独的截距和斜率。