为什么随机效应的估计方差不等于其 BLUP 估计的方差?

机器算法验证 r 混合模式 lme4-nlme 协方差 虚张声势
2022-03-19 18:56:58

我正在从这里学习混合效果模型。

我建立了一个简化模型并尝试提取γ来自线性混合效应模型的向量

y=Xβ+Zγ+ϵ

然后计算方差γ. (这是一个玩具模型,我们对截距只有随机影响,所以γ是向量而不是矩阵)

为什么它不等于模型summary(模型摘要显示 DID 截距方差为1.148,但方差为γ1.1026)。我在这里缺少什么?

> library(lme4)
> dat <-read.csv("http://stats.idre.ucla.edu/stat/data/hdp.csv")
> dat=dat[1:100,c("Age","Sex", "DID","mobility")]
> m <- lmer(mobility ~ 1 + Age + Sex +  (1 | DID), data = dat)
> summary(m)

Linear mixed model fit by REML ['lmerMod']
Formula: mobility ~ 1 + Age + Sex + (1 | DID)
   Data: dat

REML criterion at convergence: 228.5

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-3.3152 -0.4710 -0.0252  0.9330  1.7854 

Random effects:
 Groups   Name        Variance Std.Dev.
 DID      (Intercept) 1.1480   1.0714  
 Residual             0.4532   0.6732  
Number of obs: 100, groups:  DID, 5

Fixed effects:
            Estimate Std. Error t value
(Intercept)  3.28826    0.76484   4.299
Age          0.01235    0.01178   1.048
Sexmale     -0.09126    0.14836  -0.615

Correlation of Fixed Effects:
        (Intr) Age   
Age     -0.766       
Sexmale -0.097  0.030

> var(as.numeric(getME(m, "b")))
[1] 1.102682
2个回答

您检查的var(as.numeric(getME(m, "b")))是随机效应的条件模式的方差。条件模式是随机效应的最佳线性无偏预测变量 (BLUP),计算为随机效应的相对协方差因子的乘积Λu在异形偏差优化过程中使用的球形随机效应变量的条件模式。(即 all.equal( var( as.numeric(getME(m, "b"))), var( as.numeric( crossprod(getME(m, "Lambdat"), getME(m, "u"))) ) ) # TRUE 1.10...);这里_ 10.

这里要记住的关键是优化那是因为在优化期间我们针对 (θ) 是剩余偏差(有关此问题的详细信息,请参阅此优秀线程)与 REML/ML 随机效应偏差的比率;正式将随机效应的相对 Cholesky 因子放入Z. 因此,如果我们将估计的误差标准差相乘σ^θ我们将得到方差(即。all.equal( (sigma(m) * m@theta)^2, summary(m)$varcor$DID[1] ) #TRUE 1.14...这就是不平等是如何实现的。但是为什么这些不一样呢?

这又回到了 BLUP 和 REML 估计的问题;它们不能保证是相同的(猫王的回答也解释了这一点 - 是的,如果你还没有投票,请投票;gung 的回答非常相关)。还要注意,正是因为我们在标准差平面上工作,所以在检查方差时这些差异会被放大。

混合模型中的方差不是缩小的 BLUP 随机效应的方差,而是可以称为未缩小的固定效应的方差(从每个组的虚拟变量中获得),它将组的效应视为单独的估计,而不是作为您有估计方差的分布的一部分。

因此,混合更高水平的方差不是样本的估计组间方差,而是总体中估计的组间方差。

这可能会有所帮助 https://www.researchgate.net/publication/225303298_Contextual_Models_of_Urban_House_Prices_A_Comparison_of_Fixed-_and_Random-Coefficient_Models_Developed_by_Expansion

还有这个

https://www.researchgate.net/publication/252146040_Do_multilevel_models_ever_give_different_results