假设我使用倾向得分匹配来创建治疗和对照观察数据集。然后我使用一些不一定包含在倾向评分模型中的协变量运行 OLS 回归。我需要以某种方式调整标准误差吗?
匹配后需要调整OLS标准误吗?
跟进 Dimitriy 的评论,我同意。在进行倾向得分匹配分析时,有(至少)三个不确定性来源:1)PS 的估计,2)匹配,以及 3)抽样变异性。我一直在写一篇关于匹配后不确定性估计的评论,所以我将在这里简要分享这些发现。
必须估计标准误差的方式取决于匹配的执行方式。对于许多匹配形式,我们只有模拟证据来说明如何进行;对于其他人,我们有分析表达式;对于其他人,我们两者都有。k:1 匹配后没有替换(包括 1:1 匹配),证据表明使用具有对成员资格的集群稳健标准误差作为聚类变量。Austin 和 Small(2014 年)以及 Austin 的许多其他论文使用模拟证据证实了这一点,Abadie 和 Spiess(2019 年)通过分析得出了这一点。两篇论文还指出块引导程序是另一种解决方案,其中对匹配数据集进行替换采样,并在每个引导程序样本中估计效果以形成采样分布。这在统计上等同于集群稳健的标准误差。
关于如何解释倾向得分的估计存在一些争论。Abadie 和 Imbens (2016) 分析证明,当与替换匹配时,忽略倾向得分估计会使推论在估计 ATE 时变得保守,但在估计 ATT 时可能会采取任何一种方式。然而,当 Bodory 等人。(2020) 进行了一项模拟研究,试图检查 Abadie 和 Imebns 提出的解释倾向得分估计的标准误差估计器的性能,他们发现它是反保守的,并且忽略倾向得分估计的方法在经验上表现更好。Austin 的模拟还表明,忽略倾向得分的估计并使用集群稳健标准误差往往就足够了。
最后,应该知道,当协变量包含在结果模型中时,标准误差对用于估计它的方法的依赖性较小。Abadie 和 Spiess (2019) 将其推导出来进行无替换匹配,Hill 和 Reiter (2006) 通过模拟替换匹配证明了这一点。
你该怎么办?在您的结果模型中包含协变量,尤其是具有剩余不平衡或对结果具有高度预测性的协变量,并使用集群稳健的标准误差估计器来估计标准误差。您可以引用 Abadie 和 Spiess (2019) 以及 Austin 和 Small (2014) 来证明这一选择的合理性。
我将向您展示如何在 R 中实现这一点。match.data()在matchit对象上使用以提取匹配的数据集。然后使用以下代码来估计效果及其标准误差(假设Y为结果、A处理、X1协X2变量以及m.data的输出match.data()):
fit <- lm(Y ~ A + X1 + X2, data = m.data, weights = weights)
lmtest::coeftest(fit, vcov. = sandwich::vcovCL, cluster = ~subclass)
记住只解释治疗系数而不是协变量系数。
奥斯汀,PC 和 Small,DS(2014 年)。在使用无替换的倾向得分匹配时使用自举:一项模拟研究。医学统计,33(24),4306-4319。https://doi.org/10.1002/sim.6276
Abadie, A. 和 Imbens, GW (2016)。估计倾向得分的匹配。计量经济学,84(2),781-807。https://doi.org/10.3982/ECTA11293
Abadie, A. 和 Spiess, J. (2019)。强大的匹配后推理。34.
Bodory, H.、Camponovo, L.、Huber, M. 和 Lechner, M. (2020)。倾向得分匹配和加权估计的推理方法的有限样本性能。商业与经济统计杂志,38(1),183–200。https://doi.org/10.1080/07350015.2018.1476247
Hill, J. 和 Reiter, JP (2006)。使用倾向得分匹配对治疗效果进行区间估计。医学统计学,25(13),2230–2256。https://doi.org/10.1002/sim.2277