倾向得分与在回归中添加协变量有何不同,它们何时优于后者?

机器算法验证 回归 多元分析 因果关系 倾向评分
2022-01-19 07:56:56

我承认我对倾向得分和因果分析比较陌生。

作为一个新手,我不明白的一件事是使用倾向得分的“平衡”在数学上与我们在回归中添加协变量时发生的情况有何不同?该操作有什么不同,为什么它(或它)比在回归中添加子总体协变量更好?

我看过一些对这些方法进行经验比较的研究,但我还没有看到关于这两种方法的数学特性的很好的讨论,以及为什么 PSM 适合因果解释,而包括回归协变量则不适合。这个领域似乎也有很多混乱和争议,这使得事情变得更加难以接受。

对此有何想法或任何指向良好资源/论文的指针以更好地理解区别?(我正在慢慢地通过 Judea Pearl 的因果书,所以不需要指出我)

4个回答

一个很大的区别是回归以线性方式“控制”这些特征。通过倾向得分进行匹配消除了线性假设,但是,由于某些观察结果可能不匹配,您可能无法对某些群体发表任何看法。

例如,如果您正在研究一个工人培训计划,您可能让所有参与者都是男性,但控制的非参与者群体由男性和女性组成。使用回归,您可以在参与指标变量和男性指标上回归收入。您将使用您的所有数据,并可以估计一名女性参加该计划后的收入。

如果你在做匹配,你只能把男人和男人配对。因此,您不会在分析中使用任何女性,并且您的结果与她们无关。

回归可以使用线性假设进行推断,但匹配不能。所有其他假设在回归和匹配之间基本相同。匹配优于回归的好处是它是非参数的(除非你必须假设你有正确的倾向得分,如果这是你进行匹配的方式)。

有关更多讨论,请参阅我的页面,了解重点关注匹配方法的课程。尤其参见因果效应估计策略假设

此外,请务必查看Rosenbaum 和 Rubin (1983)概述倾向得分匹配的文章。

最后,自 1983 年以来,匹配已经走过了漫长的道路。查看Jas Sekhon 的网页,了解他的遗传匹配算法。

简短的回答是倾向得分并不比等效的 ANCOVA 模型好,尤其是在因果解释方面。

倾向得分最好理解为一种数据缩减方法。它们是将许多协变量减少为单个分数的有效方法,该分数可用于调整一组变量的感兴趣效应。这样做,您可以通过调整单个倾向得分而不是多个协变量来节省自由度。这当然具有统计优势,但仅此而已。

使用带有倾向得分的回归调整时可能出现的一个问题是,使用倾向得分而不是使用用于估计模型中包含的倾向得分的所有协变量进行回归调整是否有任何收益。Rosenbaum 和 Rubin 表明,每当使用相同的样本协方差矩阵时,“从多元 X 的协方差调整分析得出的治疗效果点估计值等于从基于 X 的样本线性判别式的单变量协方差调整获得的估计值用于协方差调整和判别分析”。因此,两种方法的结果应该得出相同的结论。然而,执行两步过程的一个优点是可以首先拟合一个非常复杂的倾向得分模型,其中包含交互作用和高阶项。由于该倾向评分模型的目标是获得治疗分配的最佳估计概率,因此不必担心过度参数化该模型。

从:

治疗与非随机对照组比较中偏倚减少的倾向评分方法

达戈斯蒂诺(引用罗森鲍姆和鲁宾)

D'agostino, RB 1998。在治疗与非随机对照组的比较中减少偏倚的倾向得分匹配。统计医学 17:2265–2281。

可能是迟钝的参考,但如果您有机会接触到它,我建议您阅读本书的章节(Apel 和 Sweeten,2010 年)。它是针对社会科学家的,因此在数学上可能不像您想要的那样严格,但它应该深入到足以满足您的问题的答案。

人们处理倾向得分有几种不同的方式,这些方式可能会导致与简单地在回归模型中包含协变量不同的结论。当一个匹配分数时,一个不一定对所有观察都有共同的支持(即,一个观察似乎永远没有机会进入治疗组,而一些观察总是在治疗组中)。也可以以各种方式对观察结果进行加权,从而得出不同的结论。

除了这里的答案,我还建议您查看chl 引用的问题的答案。倾向得分背后有更多的实质内容,而不仅仅是实现协变量平衡的统计技巧。如果您阅读并理解了 Rosenbaum 和 Rubin 的高引用文章,就会更清楚为什么该方法不同于简单地在回归模型中添加协变量。我认为对您的问题的更令人满意的答案不一定是倾向得分背后的数学,而是它们的逻辑。

我喜欢将 PS 视为研究的设计部分,它与分析完全分离。也就是说,您可能需要从设计 (PS) 和分析(回归等)的角度进行思考。此外,PS 提供了一种支持二元处理可交换性的方法;也许其他人可以评论在结果模型中包含协变量是否可以实际支持可交换性,或者是否在将协变量包含在结果模型中之前假设可交换性。