我有 10 个预测变量和一个结果变量。但是,我使用了三个量表来衡量结果变量。我进行了三个独立的回归分析,三个不同的尺度之一作为结果变量,10 个预测变量作为预测变量。现在,三个回归分析的显着性模式并不相同。因此,我想通过进行元分析以某种方式整合结果。任何想法如何做到这一点?
多元回归的Meta分析
回归斜率的元分析不太常见,但并非闻所未闻(有关方法细节,请参见 Aloe & Becker,2012;Peterson & Brown,2005)。这种方法的典型问题是,通常不可能(如果不是不可能)确保样本的模型等效性——如果在样本中包含/排除不同的变量组合,斜率的含义将会改变。因此,虽然计算相对简单,但意义的构建往往是不稳定的。但正如@Joe_74 正确指出的那样,对来自同一样本的所有估计值进行元分析并没有多大意义。
相反,我认为您的问题是一个很好的案例,其中结构方程建模方法可能非常有用(如果您是 SEM 新手并希望获得可访问的介绍,请参阅此线程)。我可以看到至少三种尝试解决您的问题的卓有成效的方法;我将把它简化为一个只有一个预测变量(而不是 10 个)的示例,只是为了使可视化更直接,但该方法可以通过更多编码扩展到 10 个预测变量。
方法一:观察到的标准化变量的路径分析
如果利用 SEM 的潜在变量建模能力似乎太令人生畏,最初,您可以将分析保持在观察变量的水平,在其中您可以通过您选择的变量来预测您的三个尺度。这里的主要问题是你还不能比较不同结果的斜率,因为你的结果可能会以不同的方式缩放。标准化你的结果分数预分析应该可以解决问题,然后你可以比较一个模型的拟合度,其中斜率可以自由估计跨结果(左侧的模型 1a [注意唯一的参数标签])与它们具有的模型被限制为相等(右侧的模型 1b [注意相同的参数标签])。
方法 2:一个共同结果因素的 SEM
从它的声音来看,你的三个尺度代表了测量同一潜在“事物”的三种不同方式。如果是这样,您可以将每个量表分数指定为加载到一个公因子上,然后通过您选择的变量预测该公因子。现在,由于您只有一个预测变量和一个结果,因此没有限制(和比较)的结构途径。但是,如果您有兴趣解决每个量表是否是潜在构造的同等重要指标的问题,您可以将三个因子载荷为无约束模型(右侧的模型 2a)的模型的拟合度与它们的拟合度进行比较。被限制为相等(左侧的模型 2b)。
方法 3:3 个共同因素的 SEM
最后,如果您没有看到您的三个尺度利用相同的基础结构,您可以采用 1. 和 2. 的混合方法,并分别预测尺度,但将它们建模为潜在结构,再次比较不受约束的 (模型 3a) 和约束模型 (模型 3b)。使用固定因子(即标准化潜在因子)比例设置方法将有助于确保您的斜率具有相似的比例/含义。您还可以估计因素之间的相关性(未显示,因为它会使数字有点混乱)。
参考
芦荟,上午和贝克尔,BJ(2012 年)。荟萃分析中回归预测变量的效应大小。教育和行为统计杂志,37(2),278-297。
Peterson, RA 和 Brown, SP (2005)。关于在荟萃分析中使用贝塔系数。应用心理学杂志,90(1),175-181。
- Vaitsiakhovich, T., Drichel, D., Herold, C., Lacour, A., & Becker, T. (2015)。METAINTER:全基因组关联研究中多重回归模型的荟萃分析。生物信息学,31(2),151-157。
本文介绍了对回归模型进行元分析的软件。它是为生物信息学/基因组学而设计的,人们无法进行完整的 OLS 模型拟合,因为研究中的预测变量 ( SNP ) 通常 > 100k 或 > 1M,而且案例(人)更少。在这种情况下,研究人员所做的是进行大量的小回归,一次 1 个 SNP 以及需要的控制(例如年龄、性别、来自主成分分析的祖先),然后将其组合到荟萃分析中,他们然后调用全基因组关联研究(GWAS). 他们也可以只对完整数据集进行惩罚回归,但这通常是不可能的,因为法律不允许研究人员彼此共享案例级数据,因此需要对回归模型的汇总统计数据进行荟萃分析(然而,本文开发了一种方法(lassosum),在汇总统计数据上使用套索(L1 惩罚),案例级数据的效率约为 90%)。
另一方面,如果您的单个数据集包含太多变量和许多模型,您可能希望在该数据集上运行大量不同的模型,然后对它们进行元分析。在这种情况下,在经济学中,他们使用称为贝叶斯模型平均(BMA)的东西,也称为经典估计的贝叶斯平均(BACE),可以对这种情况进行一些分析。关于这方面的经典论文是Sala-i-Martin 等人 2004 年,他用它来模拟国家之间的经济增长,因为变量太多而无法联合建模。
如果我理解正确,有 3 个回归模型(同一项研究),您希望在荟萃分析中使用这些结果。
首先,如果我们认为我们有 3 项“研究”,我认为至少需要 4 项研究才能在荟萃分析中获得最低限度的合理结果。话虽如此,如果结果根据结果的规模而有所不同,我认为这不是“元分析”问题。
相反,我们应该证明结果足够稳健,而敏感性分析在我看来是最合理的策略。事实上,在这种情况下没有研究,但只有一项研究在结果变量的生成上发生了微妙的变化。
由于结果变量的差异导致的结果差异促使我们反思用于创建此类量表的策略。顺便说一句,它们并没有在查询中公开,核心问题(以及模型的解释)很可能与不同尺度的创建有关。