基于精度(即逆方差)的加权是荟萃分析的组成部分吗?

机器算法验证 方差 样本量 缺失数据 荟萃分析
2022-03-27 07:22:41

基于精度的加权是荟萃分析的核心吗?博伦斯坦等人。(2009) 写道,要使荟萃分析成为可能,所有必要的条件是:

  1. 研究报告了可以表示为单个数字的点估计。
  2. 可以为该点估计计算方差。

我不清楚为什么(2)是绝对必要的。但是,事实上,所有被广泛接受的荟萃分析方法都依赖于基于精度(即逆方差)的加权方案,这确实需要对每项研究的影响大小的方差进行估计。请注意,虽然 Hedges 方法 (Hedges & Olkin, 1985; Hedges & Vevea, 1998) 和 Hunter and Schmidt 方法 (Hunter & Schmidt, 2004) 基本上都使用样本量加权,但这些方法仅适用于归一化均值差,因此需要其他地方的标准差。有意义的是,与每项研究中的方差成反比的权重将使总体效应大小估计量的方差最小化,那么这种加权方案是所有方法的必要特征吗?

是否有可能在没有获得每个效应大小的方差的情况下进行系统评价,并且仍然将结果称为荟萃分析?当方差不可用时,样本量似乎有可能作为精度的代表。例如,可以在效应大小被定义为原始平均差的研究中使用样本大小加权吗?这将如何影响所产生的平均效应大小的一致性和效率?

2个回答

这个问题很难回答,因为它表明了许多元分析文献中普遍的混乱和混乱的事态(这里不怪 OP——它是文献和方法的描述,模型和假设通常是一团糟)。

但长话短说:不,如果你想结合一堆估计(量化某种影响、关联程度或其他被认为相关的结果)并且结合这些数字是明智的,那么你可以取他们的(未加权的)平均值,那会很好。这并没有错,根据我们在进行元分析时通常假设的模型,这甚至可以为您提供无偏估计(假设估计本身是无偏的)。所以,不,您不需要抽样方差来组合估计值。

那么为什么逆方差加权几乎与实际进行荟萃分析同义呢?这与我们认为大型研究(具有较小的抽样方差)比小型研究(具有较大的抽样方差)更具可信度的一般思想有关。事实上,在通常模型的假设下,使用逆方差加权会导致一致的最小方差无偏估计(UMVUE)——好吧,有点,再次假设无偏估计并忽略抽样方差实际上通常不完全知道的事实,但它们本身是估计的,并且在随机效应模型中,我们还必须估计异质性的方差分量,但是我们只是把它当作一个已知的常数,这也不完全正确......但是,是的,如果我们只是非常努力地眯起眼睛并忽略其中的一些,我们会使用逆方差加权得到 UMVUE问题。

因此,这里关键的是估计器的效率,而不是无偏性本身。但是,即使是未加权平均通常也不会比使用逆方差加权平均效率低很多,尤其是在随机效应模型中以及当异质性很大时(在这种情况下,通常的加权方案会导致几乎统一的权重)反正!)。但即使在固定效应模型或几乎没有异质性的情况下,差异通常也不是压倒性的。

正如你所提到的,人们也可以很容易地考虑其他加权方案,例如按样本大小或其某些函数加权,但这只是试图获得接近逆方差权重的东西(因为抽样方差是,很大程度上取决于研究的样本量)。

但实际上,人们可以而且应该将权重和方差的问题完全“解耦”。它们实际上是一个必须考虑的两个独立部分。但这并不是文献中通常呈现的方式。

但是,这里的重点是您确实需要考虑两者。是的,您可以将未加权平均值作为您的组合估计值,这本质上是一种元分析,但是一旦您想开始基于该组合估计值进行推断(例如,进行假设检验,构建置信区间),您需要知道抽样方差(以及异质性的量)。这样想:如果你结合一堆小型(和/或非常异质)的研究,你的点估计将比你结合相同数量的非常大(和/或同质)的研究精确得多研究——不管你在计算综合价值时如何加权你的估计。

实际上,当我们开始进行推论统计时,甚至有一些方法可以不知道抽样方差(和异质性的数量)。可以考虑基于重采样的方法(例如,自举测试、置换测试)或即使我们错误指定模型的某些部分,也可以为组合估计产生一致的标准误差的方法——但是这些方法的工作效果需要仔细评估就事论事。

如果您知道一些标准错误但不是全部,这里有一个解决方案:

(1) 假设未知 SE 是从与已知 SE 相同的分布中随机抽取的,或者将具有未知 SE 的论文的估计值的 SE 分布设为自由变量。如果您想花哨,可以对这些选项使用模型平均。

(2) 通过最大似然估计

如果您对未知 SE 的研究是“异常值”,则模型将结合以下方式解释异常:

(a) 该研究的估计可能具有高 SE(该研究可能具有低功效)

(b) 该研究可能有很大的随机效应成分(研究人员选择了一个数据集或方法等,它给出了一个非典型的结果)

实际上,该模型会随着未知 SE 变得更加异常而降低估计的有效精度。在这方面,它对包含“异常值”非常稳健。同时,如果您添加大量方差未知但结果典型的研究,则 SE 或您的最终估计值将会下降。