2 因子方差分析和混合效应模型之间的差异

机器算法验证 r 方差分析 混合模式 效果
2022-04-09 17:25:20

R 中的lme4包包括cake数据集。

library(lme4)
head(cake[,2:4], 20)
   recipe temperature angle
1       A         175    42
2       A         185    46
3       A         195    47
4       A         205    39
5       A         215    53
6       A         225    42
7       B         175    39
8       B         185    46
9       B         195    51
10      B         205    49
11      B         215    55
12      B         225    42
13      C         175    46
14      C         185    44
15      C         195    45
16      C         205    46
17      C         215    48
18      C         225    63
19      A         175    47
20      A         185    29

cake使用以下两种不同的模型分析了数据集。第一个模型是 2 因子方差分析:

summary(aov(angle ~ temperature + recipe, cake))
             Df Sum Sq Mean Sq F value   Pr(>F)    
temperature   5   2100   420.1   6.918 4.37e-06 ***
recipe        2    135    67.5   1.112     0.33    
Residuals   262  15908    60.7                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

...第二个是混合效应模型,具有temperature随机效应:

lmer(angle ~ recipe + (1| temperature), data=cake, REML=F)
Linear mixed model fit by maximum likelihood 
Formula: angle ~ recipe + (1 | temperature) 
   Data: cake 
  AIC  BIC logLik deviance REMLdev
 1893 1911 -941.7     1883    1877
Random effects:
 Groups      Name        Variance Std.Dev.
 temperature (Intercept)  6.4399  2.5377  
 Residual                60.2560  7.7625  
Number of obs: 270, groups: temperature, 6

Fixed effects:
            Estimate Std. Error t value
(Intercept)   33.122      1.320  25.093
recipeB       -1.478      1.157  -1.277
recipeC       -1.522      1.157  -1.315

Correlation of Fixed Effects:
        (Intr) recipB
recipeB -0.438       
recipeC -0.438  0.500

有人能够提供混合效应模型与 ANOVA 不同之处的总结吗?

2个回答

我绝对不是专家,但这是我的贡献:

  • 在您的ANOVA模型中,您将“配方”和“温度”都视为固定因素,可以根据差异来考虑。

  • 在您的linear mixed model中,您将“温度”视为随机因素,它由分布定义,并且假定其值是从具​​有一定方差的正态分布的总体中选择的。事实证明,相应的输出现在是该方差的估计值(随机效应部分中标记为“温度”的行)。您会注意到“配方”的输出确实是平均差的估计值(在固定效应部分标记为 recipeB 和 recipeC 的行)。

非常简单:在双因素方差分析中(或更一般地说,在可以用 in 分析的模型lmR)变量是受控的。即问“在其他自变量不变的情况下,每个自变量与因变量的线性关系是什么?” 此类模型有许多假设,这里的关键是它们假设误差(由残差估计)是独立的。通常,这是合理的;而且,通常情况下并非如此。在蛋糕数据集中,情况并非如此,因为每个食谱都经过多次测试,并且模型中的错误肯定会在每个食谱中比在不同食谱之间更相似。

混合模型放宽了这个假设。