我参考这篇论文:Hayes JR,Groner JI。 “使用多重插补和倾向得分来测试汽车座椅和安全带使用对创伤登记数据的伤害严重程度的影响。” 小儿外科杂志。2008 年 5 月;43(5):924-7。
在本研究中,进行了多重插补以获得 15 个完整的数据集。然后为每个数据集计算倾向得分。然后,对于每个观察单元,从已完成的 15 个数据集中(包括相关的倾向得分)中随机选择一个记录,从而创建一个最终数据集,然后通过倾向得分匹配对其进行分析。
我的问题是:这是在多重插补后执行倾向得分匹配的有效方法吗?有其他方法吗?
背景:在我的新项目中,我的目标是使用倾向得分匹配比较两种治疗方法的效果。有缺失数据,我打算使用MICE
R中的包来估算缺失值,然后twang
进行倾向得分匹配,然后lme4
分析匹配的数据。
更新1:
我发现这篇论文采用了不同的方法:Mitra, Robin and Reiter, Jerome P. (2011) Propensity score matching with missing covariates via itered,sequential multiple imputation [工作论文]
在本文中,作者计算了所有插补数据集的倾向得分,然后通过平均将它们汇集在一起,这是使用鲁宾规则进行点估计的多重插补的精神 - 但它真的适用于倾向得分吗?
如果 CV 上的任何人都可以提供对这两种不同方法和/或任何其他方法的评论的答案,那将是非常好的......