为什么不对部分模拟数据进行荟萃分析?

机器算法验证 模拟 荟萃分析
2022-03-20 17:58:49

背景:

心理学中的典型元分析可能会试图对两个变量 X 和 Y 之间的相关性进行建模。分析通常涉及从文献中获取一组相关的相关性以及样本量。然后可以应用公式来计算加权平均相关性。然后,可以进行分析以查看研究之间的相关性变化是否超过随机抽样的影响所暗示的差异。

此外,分析可以变得更加复杂。估计值可以根据可靠性、范围限制等进行调整。相关性可以结合使用来探索元结构方程建模或元回归等。

然而,所有这些分析都是使用汇总统计数据(例如,相关性、优势比、标准化平均差)作为输入数据进行的。这需要使用接受汇总统计的特殊公式和程序。

荟萃分析的替代方法

因此,我正在考虑使用原始数据作为输入的元分析的替代方法。即,对于相关性,输入数据将是用于形成相关性的原始数据。显然,在大多数荟萃分析中,即使不是大部分,也有几个实际原始数据不可用。因此,基本过程可能如下所示:

  1. 联系所有已发表的作者寻求原始数据,如果提供,请使用实际的原始数据
  2. 对于不提供原始数据的作者,模拟原始数据,使其具有与报告的相同的汇总统计数据。这种模拟还可以结合从原始数据中获得的任何知识(例如,如果已知变量是偏斜的,等等)。

在我看来,这种方法可能有几个好处:

  • 使用原始数据作为输入的统计工具可用于分析
  • 通过至少获得一些实际的原始数据,荟萃分析的作者将被迫考虑与实际数据相关的问题(例如,异常值、分布等)。

问题

  • 对真实原始数据和模拟数据的组合进行荟萃分析研究是否存在与现有已发表研究具有相同汇总统计数据的任何问题?
  • 这种方法会优于对汇总统计进行荟萃分析的现有方法吗?
  • 是否有任何现有文献讨论、倡导或批评这种方法?
2个回答

我感谢@Bernd 为我指明了正确的方向。以下是他在回答中提到的参考文献的一些注释,以及这些文章中提到的一些参考文献。

萨顿等人(2008 年)

Sutton 等人在健康环境中使用术语个体患者数据汇总数据

他们指出,对个体患者数据的分析通常被认为是荟萃分析的黄金标准,引用了 Stewart 和 Clark (1995)。它对于评估数据质量和对现有报告中未报告的值进行分析(例如,特定的亚组分析)特别有用。他们自然会注意到一些问题,例如在某些情况下无法获得所有个体患者数据以及处理此类数据的额外成本。他们还观察到,对于可获得汇总统计数据的简单模型,结果通常相似或相同。

他们还观察到引用 Simmonds 等人 (2005) 的评论的个别患者荟萃分析的频率很低。他们还提到了 Riley RD、Simmonds 等人 (2008) 将个体患者数据与汇总数据相结合的荟萃分析评论文章

莱利·兰伯特·阿博-扎伊德 (2010)

在这篇文章中,Riley 等人描述了更多关于个体参与者数据的元分析。他们概述了对个体参与者数据进行元分析的优势(例如,一致的数据处理、缺失数据的建模、原始报告结果的验证、更多的分析选项等)

斯图尔特和蒂尔尼 (2002)

斯图尔特和蒂尔尼回顾了个体患者数据荟萃分析的优缺点,特别关注实际问题。

莱利兰伯特等人 (2007)

他们描述了用一步法和两步法将个体患者数据与聚合数据相结合的方法。

库珀和帕托 (2009)

Cooper 和 Patall 写了一篇文章,作为心理学方法中个体水平数据荟萃分析的特刊的一部分(参见 Shrout,2009 年的摘要)。Cooper 和 Patall 将研究综合描述为过渡的第二阶段:

第一个转变是从叙述性研究综述——其中使用不透明的认知代数规则来综合研究结果——到[聚合数据]的元分析。第二阶段涉及从[汇总数据]的元分析过渡到[个人参与者级别数据]的积累。

待续...

参考

  • Cooper, H. 和 Patall, EA (2009)。使用个体参与者数据与汇总数据进行荟萃分析的相对优势。心理方法,14(2),165-176。doi:10.1037/a0015565
  • Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., & Boutitie, F. (2007)。结合个体患者数据和汇总数据的连续结果的荟萃分析。医学统计,27(11),1870-1893。doi:10.1002/sim.3165 [PDF] (http://www.staessen.net/publications/2006-2010/08-21-P.pdf)
  • Riley, RD, Lambert, PC 和 Abo-Zaid, G. (2010)。个体参与者数据的元分析:基本原理、行为和报告,BMJ,340, 221。
  • Riley RD,Simmonds MC,Look MP。(2007) 结合个体患者数据和汇总数据的证据综合:系统评价确定了当前的实践和可能的方法。临床流行病学杂志,印刷中和早期视图。
  • Riley, RD 和 Steyerberg, EW (2010)。使用个体参与者数据和汇总数据对二元结果进行元分析。研究综合方法,1(1),2-19。doi:10.1002/jrsm.4
  • 史劳特,PE(2009 年)。综合数据分析的短期和长期观点:对特刊贡献的评论.. 心理方法,14, 177。
  • 西蒙兹 MC,希金斯 JPT,斯图尔特 LA,蒂尔尼 JF,克拉克 MJ,汤普森 SG。(2005 年)。来自随机试验的个体患者数据的荟萃分析:对实践中使用的方法的回顾。临床试验 ; 2:209-217。
  • 斯图尔特洛杉矶,克拉克 MJ。使用更新的个体患者数据进行荟萃分析(概述)的实用方法。科克伦工作组。1995年医学统计;14:2057-2079。
  • 斯图尔特洛杉矶,蒂尔尼 JF。IPD 还是不 IPD?使用个体患者数据进行系统评价的优缺点。评估健康教授 2002;25:76-97。
  • Sutton, AJ, Kendrick, D. 和 Coupland, CAC (2008)。个人和总体数据的荟萃分析。医学统计,27(5),651-669。

已经存在旨在合成个人和聚合个人数据的方法。萨顿等人。(2008)论文应用了贝叶斯方法,(恕我直言)与您的想法有一些相似之处。

  • Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., & Boutitie, F. (2007)。结合个体患者数据和汇总数据的连续结果的荟萃分析。医学统计,27(11),1870-1893。doi:10.1002/sim.3165 PDF

  • Riley, RD 和 Steyerberg, EW (2010)。使用个体参与者数据和汇总数据对二元结果进行元分析。研究综合方法,1(1),2-19。doi:10.1002/jrsm.4

  • Sutton, AJ, Kendrick, D. 和 Coupland, CAC (2008)。个人和总体数据的荟萃分析。医学统计,27(5),651-669。