倾向评分是否反映了治疗或结果的概率?

机器算法验证 倾向评分
2022-04-03 09:59:01

我是一名非统计学博士生,正在从事一个涉及一些倾向得分匹配 (PSM) 的项目。我最初假设倾向得分将代表每个患者在给定基线特征的情况下接受感兴趣结果的概率。然而,我随后阅读的所有内容都表明,倾向得分代表了每个患者被分配到一个治疗组的概率。

这是我对 PSM 的新理解,直到我完成分析并且该项目的一位高级统计学家评论说我完全误解了 PSM,因为应该计算倾向得分来代表每个患者收到感兴趣的结果的概率。

我不确定如何将这与我对 PSM 的阅读联系起来,尽管我也意识到我无法轻松阅读该领域的许多技术论文。这里有没有人能帮助我理解倾向得分是否应该代表治疗或结果的概率,以及在回复这位统计学家时我应该有多自信?

3个回答

倾向是分配的治疗,而不是结果。

虽然存在倾向强烈模仿随机化的自然情况,但在更多情况下,治疗以尽可能非随机的方式确定。给定足够大的样本,搜索治疗分配的概率将是成功的。如果可以从数据中完美地确定治疗分配,则应仔细检查这些变量是否可能代表治疗偏倚(除非另有证明,否则有罪)。如果倾向是衡量疾病严重程度的潜在变量,则从倾向匹配或回归中获得的基本估计可能存在偏差。

倾向评分大部分是由唐纳德·鲁宾(Donald Rubin)开发的。这是他 1983 年与 Biometrika 的 Rosenbaum 合作的论文的摘要。

倾向得分是在给定观察到的协变量向量的情况下分配给特定治疗的条件概率大样本和小样本理论都表明,对标量倾向得分的调整足以消除由于所有观察到的协变量引起的偏差。应用包括:(i)单变量倾向得分的匹配抽样,这是判别匹配的概括,(ii)通过对倾向得分的子分类进行多变量调整,其中相同的子类用于估计所有结果变量和所有结果变量的治疗效果亚群,以及 (iii) 通过二维图直观表示多元协方差调整。

保罗·R·罗斯鲍姆,唐纳德·B·鲁宾;倾向评分在因果效应观察研究中的核心作用,Biometrika,第 70 卷,第 1 期,1983 年 4 月 1 日,第 41-55 页,https: //doi.org/10.1093/biomet/70.1.41

倾向得分和混杂调整之间有很强的联系。混杂因素预测结果接受治疗1,因此作为混杂因素的候选因素是候选倾向因素的子集。因此,当您选择协变量来开发倾向得分时,通常情况下它们也可以预测结果。这并不奇怪。比较癌症治疗与生存率。晚期癌症患者可能会选择更积极的治疗,因此当您比较生存率时,诊断时的癌症分期是一个非常重要的混杂因素。

1它们比这更微妙一些,请参阅 Pearl,Causality 2nd edition。

正如其他人所说,倾向得分代表接受治疗的概率。来自Stata手册的本机倾向得分匹配命令(强调我的):

倾向得分匹配使用获得其他治疗水平的相似受试者的结果的平均值来估算每个受试者缺失的潜在结果。ATE 是通过取每个受试者观察到的结果和潜在结果之间的差异的平均值来计算的。teffects psmatch通过使用估计的治疗概率(称为倾向得分)确定受试者彼此之间的距离。这种类型的匹配称为倾向得分匹配 (PSM)。

因此,倾向得分匹配用于计算平均治疗效果或被治疗者之间的平均治疗效果,但它是通过匹配倾向得分上的个体观察来实现的。正如您在上面看到的,这是接受治疗的概率。

现在,请注意,您可以将倾向评分与感兴趣的连续或二元结果(或计数,或您能想象的任何其他结果)一起使用。也许您的案例的结果是二元的,这是误解的根源?无论哪种方式,倾向得分本身就是,正如令人作呕的所说,接受治疗的概率,如果高级统计学家认真认为这是接受结果的概率,那么这个人没有资格成为高级统计学家. 我赌的是误会。