超过 2 组的倾向得分匹配

机器算法验证 r 倾向评分
2022-03-28 12:23:37

我是倾向得分匹配(PSM)的新手。所以,我的问题可能有点琐碎。

1) 假设我有 3 个处理级别,并且想要检查处理级别的有效性。治疗水平是按时服药、不按时服药、不定时服药。为此,我需要进行多项逻辑回归。

但在 PSM 中,我们进行病例对照研究。那么,我们将如何定义哪个是这种情况,哪个是控制?会不会是每次都用一组做对照,另外两组做case?

2)谁能告诉我R中的多级组使用哪个包。我检查了这个链接。但是这个链接是旧的。我还检查了这个似乎是多层次的包。但是还有其他选择吗?

3个回答

倾向得分计算和随后的配对分析可以通过多种方式进行。您可能希望查看 CV 中的一些重叠问答:

  1. R中的倾向得分匹配与多种治疗
  2. 按倾向得分匹配 6 组的软件?
  3. 将两种或多种治疗方法与治疗权重的逆概率进行比较

我的建议是使用twang R 包。

检查WeightIt包裹。您可以简单地提供一个因子处理变量和协变量,它将估计该处理的平衡权重。它为使用统一语法的其他包和方法提供了一个接口。

目前,它为使用多项逻辑和概率回归倾向得分、广义增强建模倾向得分(通过twang)、协变量平衡倾向得分(通过CBPS)、熵平衡(通过ebal)、基于优化的权重(通过optweight)、经验平衡校准权重(通过ATE)和超级学习者倾向得分(通过SuperLearner)。语法如下:

w.out <- weightit(treat ~ cov1 + cov2 + cov3, data = data, method = "ps")

method您可以使用参数和其他更改估计方法。

我主要使用 PSM 解决 2 类问题。我们预测治疗的概率。然后在我们的概率分数的相同十分位数中比较治疗与对照的效果。处于相同十分位的客户通常是相似的,因此具有可比性。所以你可以重复 PSM 两次。控制每一个按时吃药的人。虽然我不确定进行测试是否会导致更高的 1 型错误,例如多次 t 测试。

对于 2 个变量的 r 中的 PSM,有一个包 matchit,但没有使用它。