Cox PH分析和协变量选择中的倾向得分加权

机器算法验证 r 生存 cox模型 倾向评分
2022-02-28 20:24:03

关于对事件发生时间生存数据进行 Cox 比例风险建模时的倾向得分加权 (IPTW):

我有前瞻性的注册数据,我们有兴趣查看在大多数情况下患者在基线时已经服用的药物的治疗效果。因此,我不确定如何最好地分析数据。潜在地,一些基线变量在很大程度上受治疗影响,而不是相反(例如某些生物标志物)。对于我应该在估计权重的倾向得分模型中包含哪些协变量以及我应该在coxph模型中包含哪些协变量(如果有的话),我有点迷茫。任何正确方向的提示都会有所帮助!到目前为止,我还没有在 CoxPh 建模中找到任何关于此的文献。

我认为代表在基线开始的治疗(可能)影响结果的协变量应该包括在 Cox PH 协变量中,但我不确定这一点。

如何确定哪些变量应作为协变量包含在 Cox 模型中,而不是用于计算倾向得分权重?


后续问题:

我理解评估已经开始的某种干预的治疗效果的遗传问题 - 即在开始观察之前在患者中普遍存在。关于引入与风险随时间变化相关的偏倚(例如,在治疗的第一年更常见的不良副作用)和受治疗影响的协变量。如果我没记错的话——这被认为是导致心血管终点和激素替代疗法的观察性和随机性之间存在差异的原因。另一方面,在我的数据集中,我们有兴趣查看治疗可能产生的不利影响。

如果我使用倾向评分调整来调查流行用户的治疗效果,即在观察开始之前已经使用药物,在队列数据中,我们观察到药物治疗的副作用(这就是我们正在寻找的)。我可以排除高估与治疗相关的风险的可能性吗?即只要风险显着升高,它最“肯定”不是保护性的?

在这种情况下,我无法完全描绘出这种偏见会导致高估虚假风险关联风险的例子。

2个回答

理论上,您选择作为倾向得分权重的一部分的每个变量都不需要作为协变量包含在模型中,因为权重已经控制了它们的潜在混淆。使用适当的加权模型,您可以毫不夸张地模拟曝光的效果。

话虽如此,您可能希望在模型中包含术语:

  • “双重稳健”的估计。除了精度损失外,没有任何理由不能在加权模型和协变量中使用变量。从理论上讲,您可以保护自己免受两种方式的混淆(因此这种技术被称为“双重稳健”)。请记住,这只会通过给您“第二次机会”来指定正确的模型来保护您免受 PS 模型或协变量模型的错误指定,这并不是万能的。
  • 利息的多重估计。加权使协变量的影响估计消失 - 如果您想要变量的回归系数,您将希望将其作为协变量包含在 CoxPH 步骤中,而不是包含在 PS 模型中。

尝试在EpidemiologyThe American Journal of Epidemiology等期刊以及生物统计学文献中搜索“双重稳健”和类似术语,您应该会发现一些有用的来源。

区分“受治疗影响”和“与治疗有关”很重要。后者可以包括治疗选择因素,例如我们试图通过倾向和/或协变量调整进行调整的因素。“受治疗影响”意味着协变量是在零时间后测量的(例如,随机化后或治疗开始后),这意味着它们应该很少使用。