您描述的过程不是倾向得分匹配,而是倾向得分子分类。在倾向得分匹配中,根据倾向得分之间的差异选择成对的单元,并丢弃未配对的单元。这两种方法都是使用倾向评分来减少在观察性研究中导致混淆偏差的不平衡的流行方法。
在倾向得分匹配中,两个单元之间的距离是它们倾向得分之间的差,倾向得分是根据协变量计算的,因此通过倾向得分匹配,您是基于距离度量和协变量值进行匹配。还有其他不涉及匹配中经常使用的倾向得分的距离度量,例如马氏距离。一些研究表明,作为距离度量,马氏距离比倾向得分差更有效,而一些研究表明并非如此。每个的相对性能取决于数据集的独特特征;对于哪种方法更好,没有办法提供一个始终正确的单一规则。两者都应该尝试。您还可以将倾向得分作为协变量包含在马氏距离中。
如果您的问题更多是关于为什么我们会在可以进行倾向得分匹配时进行倾向得分子分类,那么有一些考虑因素。和以前一样,您应该始终使用在您的样品中产生最佳平衡的任何方法。倾向得分子分类可以更好地实现某些数据集的平衡和其他数据集的倾向得分匹配。没有理由单方面决定使用一种方法而不是另一种方法。子分类允许您估计 ATT 或 ATE,而大多数匹配方法只允许 ATT。当以某些方式使用时,子分类与倾向得分加权密切相关,而匹配通常不会为个体分配不均匀的权重。通过匹配,您可以更多地自定义规格(例如,通过使用卡尺,通过改变控制与处理的比率等),而通过子分类,定制的机会更加有限。面对完全匹配,匹配和子分类之间的区别是模糊的,完全匹配是两者之间的混合体,通常表现得更好。一些论文比较了这两种方法的性能,但正如我之前提到的,重要的是不要依赖一般结果,而是在样本中尝试这两种方法。
查看 R 包的文档,MatchIt
其中详细介绍了几种匹配方法,并讨论了它们的一些相对优点和自定义方法。