元回归(metafor)中异常大的 R 平方值

机器算法验证 r 荟萃分析 元回归
2022-04-03 17:17:55

我在 R 中使用 metafor 包。我已经拟合了一个带有连续预测器的随机效应模型,如下所示

SIZE=rma(yi=Ds,sei=SE,data=VPPOOLed,mods=~SIZE)

产生输出:

R^2 (amount of heterogeneity accounted for):            63.62%
Test of Moderators (coefficient(s) 2): 
QM(df = 1) = 9.3255, p-val = 0.0023

Model Results:

                 se    zval    pval   ci.lb   ci.ub    
intrcpt  0.3266  0.1030  3.1721  0.0015  0.1248  0.5285  **
SIZE     0.0481  0.0157  3.0538  0.0023  0.0172  0.0790  **

下面我绘制了回归。效果大小与标准误差的倒数成比例绘制。我意识到这是一个主观陈述,但 R2(解释了 63% 的方差)值似乎比图中显示的适度关系所反映的要大得多(即使考虑到权重)。

在此处输入图像描述

为了向您展示我的意思,如果我然后使用 lm 函数进行相同的回归(以相同的方式指定研究权重):

lmod=lm(Ds~SIZE,weights=1/SE,data=VPPOOLed)

然后 R2 下降到 28% 的方差解释。这似乎更接近事情的本来面目(或者至少,我对什么样的 R2 应该对应于情节的印象)。

在阅读了这篇文章(包括元回归部分)后,我意识到:(http://www.metafor-project.org/doku.php/tips:rma_vs_lm_and_lme),lm 和 rma 函数应用方式的差异权重会影响模型系数。但是,我仍然不清楚为什么在元回归的情况下 R2 值要大得多。为什么看起来适度拟合的模型占效应异质性的一半以上?

较大的 R2 值是因为在元分析案例中方差的划分方式不同吗?(抽样可变性与其他来源)具体而言,R2 是否反映了在不能归因于抽样可变性的部分中所考虑的异质性百分比?也许非元分析回归中的“方差”与元分析回归中的“异质性”之间存在差异,我并不欣赏。

恐怕像“这似乎不对”这样的主观陈述是我必须在这里继续的。在元回归案例中解释 R2 的任何帮助将不胜感激。

1个回答

报告的伪值计算如下:其中是基于随机效应模型和估计的(总)异质性量是基于混合效应元回归模型估计的(剩余)异质性的量。请注意,这不是特定于包的任何东西——它通常是在混合效应元回归模型中计算这个值的方式。R2

R2=τ^RE2τ^ME2τ^RE2,
τ^RE2τ^ME2metafor

该值估计了元回归模型中包含的调节因子/协变量所解释的异质性数量(即,在模型中包括调节因子/协变量后,异质性数量的比例减少)。请注意,它根本不涉及抽样可变性。因此,很有可能得到非常大的值,即使回归线和观察到的效应大小之间仍然存在差异(当这些差异并不比仅基于抽样变异性所预期的大很多时)。事实上,当(这肯定会发生)时,R2τ^ME2=0R2=1- 但这并不意味着这些点都落在回归线上(残差只是不大于基于抽样变异性的预期)。

无论如何,重要的是要认识到这个伪统计量不是很可信,除非研究的数量很大。例如,请参阅这篇文章:R2

López-López, JA, Marín-Martínez, F., Sánchez-Meca, J., Van den Noortgate, W. 和 Viechtbauer, W. (2014)。混合效应元回归中模型预测能力的估计:模拟研究。英国数学与统计心理学杂志,67(1),30-48。

从本质上讲,除非您至少进行 30 项研究(但不要在该数字上准确引用我的话),否则我不会太相信实际价值。对于一个很好的练习,您可以使用自举来获得的近似 CI 。几乎所有你需要知道的都在这里解释:R2

http://www.metafor-project.org/doku.php/tips:bootstrapping_with_ma

boot.func()只需将函数返回的值更改res$R2没有方差估计,因此您无法获得学生化区间)。在您的情况下,您最终可能会得到一个非常宽的 CI(可能几乎从 0 扩展到 100%)。R2