lmer 模型报告的自由度似乎不可信

机器算法验证 r 统计学意义 lme4-nlme 自由程度
2022-04-18 02:42:32

关于模型的自由度,我有一些问题lmer

这是输出:

lmF3<-lmer(var ~ cond  + (1|subj) + (1|blocks) , data=data)


                Estimate Std. Error     df     t value Pr(>|t|)    
(Intercept)     -0.12844    0.04238    2.30000  -3.031   0.0794 .  
B                0.28143    0.04584 1002.20000   6.139 1.19e-09 ***

我有一个不平衡的设计,总共 1000 个 obs,条件 A 下 200 个,条件 B 下 800 个。

我对模型的 df 有一些疑问......特别是关于截距的 df(2.3),甚至是 A 与 B 的对比(1002.2)。

我认为有一些问题......但我不知道究竟是什么。这些 df 是否合理,或者您认为出了什么问题?

2个回答

您是否使用 lmerTest 包来获取您的 p 值以输出 lmer 对象的摘要?如果是这样,您正在使用 Satterthwaite 近似估计自由度。输出的顶部应该是这样的:

t-tests use  Satterthwaite approximations to degrees of freedom

我假设您在问这些 dfs 是否合理,因为它们不是整数——它们有小数?由于没有直接的方法来计算这些多级模型的 dfs,因此使用了不同的近似值,这为您提供了不一定是整数的 dfs。

你如何定义“合理的”自由度?

简单来说,计算 GLMM 的自由度很复杂,没有简单的计算公式。让我引用r-sig-mixed-models 常见问题解答

(有一个关于这个主题的R 常见问题解答条目,它链接到 Doug Bates 的邮件列表帖子(在 R wiki 上也有一个大量的邮件列表线程)。底线是

  • 一般来说,对于任何分母自由度的选择,计算的平方和比率的零分布是否真的是 F 分布并不清楚。虽然这对于与经典实验设计(嵌套、裂区、随机块等)相对应的特殊情况是正确的,但对于更复杂的设计(不平衡、GLMM、时间或空间相关性等)显然不是这样。
  • 对于已建议的每个简单自由度配方(帽子矩阵的轨迹等),似乎至少有一个相当简单的反例,其中配方严重失败。
  • 已经提出的其他 df 近似方案(Satterthwaite、Kenward-Roger 等)显然很难在 lme4/nlme 中实现,这既是因为符号框架的差异,也是因为在大数据集。(Kenward-Roger 方法现在已经在 pbkrtest 包(作为 KRmodcomp)中实现:虽然它是为 LMM 派生的,但 Stroup [29] 根据(未提供的)模拟结果表明它实际上对 GLMM 工作得相当好。然而,目前 KRmodcomp 中的代码只处理 LMM。)
  • 请注意,在有限大小(小样本)调整中存在几个不同的问题,它们对 LMM 和 GLMM 的应用略有不同。
    • 当响应呈正态分布并且设计是平衡的、嵌套的等(即经典 LMM 情况)时,缩放偏差和偏差差异正好是 F 分布的,并查看实验设计(即,哪些处理变化/重复在哪个级别)告诉我们相关的自由度是多少。
    • 当数据不是经典的(交叉、不平衡、R 副作用)时,我们可能仍然猜测偏差等是近似 F 分布的,但我们不知道真正的自由度——这就是 Satterthwaite, Kenward-Roger、Fai-Cornelius 等近似值应该可以。
    • 当响应不是正态分布时(如在 GLM 和 GLMM 中),并且当未估计尺度参数时(如在标准泊松和二项式响应模型中),则偏差差异只是渐近 F 或卡方分布式(即不适用于我们真实的、有限大小的样本)。在标准的 GLM 实践中,我们通常会忽略这个问题;在“Bartlett 校正”和“高阶渐近”的标题下,有一些关于 GLM 的有限尺寸校正的文献(参见 Cordeiro 的工作的 McCullagh 和 Nelder,以及 CRAN 上的 cond 包 [它适用于 GLM,而不是 GLMM] ),但很少使用。(在 brglm 包中实现的偏差校正/Firth 方法试图解决有限大小偏差的问题,
    • 当 GLM 中的尺度参数是估计的而不是固定的(如在 Gamma 或准似然模型中)时,有时建议使用 F 检验来说明尺度参数的不确定性(例如,Venables 和 Ripley 建议使用 anova(... ,test="F") 用于准似然模型)
    • 结合这些问题,人们必须非常努力地寻找有关 GLMM 的小样本或有限大小校正的信息:Feng et al 2004 [14] 和 Bell 和 Grunwald 2010 [6] 看起来是很好的起点,但根本不是琐碎的。
  • 因为 lme4 的主要作者不相信参考近似空分布的一般测试方法的实用性,并且因为其他任何人挖掘代码以启用相关功能(作为补丁或添加)的开销-on),这种情况在未来不太可能改变。