了解线性混合模型中的随机效应(lme4,R)

机器算法验证 r 混合模式 lme4-nlme
2022-04-10 14:14:40

我熟悉线性回归模型,但线性混合模型的随机部分让我大吃一惊。我确实找到了一个可以帮助我的优秀指南,但是 languageR 包与新版本的 lme4 不兼容,所以我无法在我的工作中实现它。

对我来说,固定效应是很容易理解的(低于哺乳期和更高的 yr2 值都有助于增加体重,但哺乳期效应更一致,从而导致更高的 t 值)。

第一个问题是要了解我实际输入的内容。在一定程度上我理解这(1|P$grupp)意味着混合模型添加到基线(截距)而(P$grupp|P$lweek)意味着属于一个组预计会影响平均体重增加(或减少)同时P$lweek增加基线值。但是为什么所有的教程似乎都倾向于像(1+P$fgrupp|P$lweek)而不是像这样的文章(P$grupp|P$lweek)呢?

现在进入实际输出(完整输出见下文)。我使用了以下模型(对不起,Swenglish,但样本是奶牛P$vikt的重量是特定时间点的体重,P$lweek是小牛出生后的时间,P$fgrupp是判断奶牛是否属于饲料组 1 的因素, 2 或 3):

Formula: P$vikt ~ P$lweek + P$laktation + P$yr + (1 | P$fgrupp)            #$
Formula: P$vikt ~ P$lweek + P$laktation + P$yr + (1 + P$fgrupp | P$lweek)

我将其理解为第一个相当无用(本质上它告诉我们奶牛的平均体重也不受它属于哪个饲料组的影响)。这反映在 fgrupp 在下面的第一个公式中具有方差 0。第二个更有趣,P$fgrupp|P$lweek因为据我了解,它应该显示不同的饲料组是否会随着时间的推移影响奶牛的体重增加。但我真的没有足够的能力来理解输入。我理解方差在某种程度上意味着属于第 2 组或第 3 组解释了增长曲线中的一些变化,但我真的不明白如何解释这一点。

Random effects:
 Groups   Name        Variance Std.Dev. Corr        
 P$lweek  (Intercept)   13.068  3.6149                                     #$
          P$fgrupp2     77.230  8.7881  1.000                              #$
          P$fgrupp3     81.188  9.0104  1.000 1.000                        #$
 Residual             4031.831 63.4967              
Number of obs: 1048, groups: P$lweek, 84

全输出

#First model#
Linear mixed model fit by REML 
Formula: P$vikt ~ P$lweek + P$laktation + P$yr + (1 | P$fgrupp)            #$
   AIC   BIC logLik deviance REMLdev
 11703 11732  -5845    11698   11691
Random effects:
 Groups   Name        Variance Std.Dev.
 P$fgrupp (Intercept)    0.0    0.000                                      #$
 Residual             4139.9   64.342  
Number of obs: 1048, groups: P$fgrupp, 3                                   #$

Fixed effects:
            Estimate Std. Error t value
(Intercept)  509.593      4.683  108.82
P$lweek        1.028      0.105    9.79                                    #$
P$laktation   22.789      1.454   15.67                                    #$
P$yr2         35.294      4.093    8.62                                    #$

Correlation of Fixed Effects:
            (Intr) P$lwek P$lktt                                           #$
P$lweek     -0.560                                                         #$
P$laktation -0.636  0.030                                                  #$
P$yr2       -0.240 -0.034 -0.141                                           #$


#Second model#

Linear mixed model fit by REML 
Formula: P$vikt ~ P$lweek + P$laktation + P$yr + (1 + P$fgrupp | P$lweek)  #$
       AIC   BIC logLik deviance REMLdev
     11707 11761  -5842    11693   11685
    Random effects:
     Groups   Name        Variance Std.Dev. Corr        
     P$lweek  (Intercept)   13.068  3.6149                                     #$
              P$fgrupp2     77.230  8.7881  1.000                              #$
              P$fgrupp3     81.188  9.0104  1.000 1.000                        #$
     Residual             4031.831 63.4967              
    Number of obs: 1048, groups: P$lweek, 84                                   #$

Fixed effects:
            Estimate Std. Error t value
(Intercept) 508.2291     5.1770   98.17
P$lweek       1.0662     0.1192    8.94                                    #$
P$laktation  22.6525     1.4459   15.67                                    #$
P$yr2        35.6343     4.0848    8.72                                    #$

Correlation of Fixed Effects:
            (Intr) P$lwek P$lktt                                           #$$
P$lweek     -0.627                                                         #$
P$laktation -0.570  0.025                                                  #$
P$yr2       -0.224 -0.018 -0.136                                           #$
1个回答

要回答您的问题(或至少部分问题),为什么所有教程似乎都倾向于像(1+P$fgrupp|P$lweek)而不是(P$grupp|P$lweek)......我认为答案是他们只是试图在他们的符号中更加清晰。 (1+P$fgrupp|P$lweek)(P$grupp|P$lweek)产生相同的结果。但是,(P$grupp|P$lweek)这意味着存在估计的截距,其中 as(1+P$grupp|P$lweek)使其明确。顺便说一句,如果您不想估计截距,您可以将 1 替换为 0,例如(0+P$grupp|P$lweek).

顺便说一句,罗兰可能是对的。 P$fgrupp|P$lweek将尝试为数据中的每个“lweek”估计组的不同影响。如果 'lweek' 是周,这可能不是合适的分组因素。什么是合适的分组因素、饲料类型或奶牛将取决于您的实验设计。