配对还是不配对?在倾向得分匹配后比较组

机器算法验证 可能性 t检验 倾向评分
2022-03-31 07:14:36

在倾向得分匹配后,例如 1:1 匹配,您将获得匹配的数据子集。

Matching包中的内置函数,作为一个突出的例子,在匹配前使用非配对 t 检验比较组,但然后切换到配对 t 检验以比较匹配后的组。

至少在医学期刊上的出版物显然没有报告他们选择了哪种类型的 t 检验。据我所知,我还没有看到一个使用配对测试的人,这与 J Sekhons Matching 包形成了强烈的对比。

我“确实喜欢其余的”并使用非配对 t 检验来比较倾向得分匹配队列(1:1 匹配)中的连续变量。

这是错的吗?

1个回答

我个人发现,当您使用配对和非配对测试时,结果非常相似。然而,我的建议是建立在对该主题进行广泛研究的基础上,并遵循权威来源,例如来自Austin的这篇文章,现在是使用识别数据集的聚类特征的测试。

因此,如果我使用倾向得分分位数(例如五分位数)或倾向匹配对,我通常在 Stata 中使用 meglm 或 xtgee 用于连续或分类变量,并使用分层 Cox 比例风险分析进行生存分析。

具体来说,同样来自Austin的以下摘录非常清楚:

在估计治疗效果的统计显着性时,建议使用说明样本匹配性质的方法(Austin,2009d,in press-b)。因此,McNemar 检验用于评估风险差异的统计显着性。置信区间是使用 Agresti 和 Min (2004) 提出的方法构建的,该方法说明了样本的匹配性质。需要治疗的人数 (NNT) 是绝对风险降低的倒数。相对风险估计为匹配样本中接受治疗的参与者与未接受治疗的参与者的 3 年死亡率概率的比率。Agresti 和 Min 描述的方法用于估计 95% 的置信区间。

然后,我们估计了提供戒烟咨询对死亡时间的影响。对倾向评分匹配样本中接受治疗和未治疗的参与者分别估计 Kaplan-Meier 生存曲线。对数秩检验不适用于比较治疗组之间的 Kaplan-Meier 生存曲线,因为该检验假设两个独立样本 (Harrington, 2005; Klein & Moeschberger, 1997)。然而,分层对数秩检验适用于配对数据(Klein & Moeschberger,1997)。

最后,我们使用 Cox 比例风险模型对表示治疗状态的指标变量(戒烟咨询与不咨询)的生存时间进行回归。由于倾向得分匹配样本不包含独立观察,我们使用了具有稳健标准误差的边际生存模型(Lin & Wei,1989)。使用具有稳健方差估计的边际模型的替代方法是拟合在匹配对上分层的 Cox 比例风险模型(Cummings、McKnight 和 Greenland,2003 年)。这种方法通过允许基线风险函数在匹配集之间变化来解释对内同质性。