我在 R 中使用 MatchIt 包创建了一个匹配队列。我有治疗组和对照组中的成员列表。但我无法弄清楚哪个治疗对象与哪个对照组相匹配。有人可以指点我吗?这对我来说非常重要。
提前致谢。
我在 R 中使用 MatchIt 包创建了一个匹配队列。我有治疗组和对照组中的成员列表。但我无法弄清楚哪个治疗对象与哪个对照组相匹配。有人可以指点我吗?这对我来说非常重要。
提前致谢。
library(MatchIt)
# I used mahalanobis distance here for nearest neighborhood matching and
# data nuclear plants
zz <- matchit(pr ~ t1 + t2, data=nuclearplants, method="nearest",
distance="mahalanobis", replace=TRUE)
> zz
Call: matchit(formula = pr ~ t1 + t2, data = nuclearplants, method = "nearest",
distance = "mahalanobis", replace = TRUE)
Sample sizes:
Control Treated
All 22 10
Matched 6 10
Unmatched 16 0
Discarded 0 0
zz.out <- zz$match.matrix # This gives us the matched matrix
> zz.out
1
A "I"
B "N"
C "M"
D "V"
E "X"
F "Z"
G "Z"
a "N"
b "N"
c "I"
注意:第一列是治疗对象,第二列是对照对象。正如你所看到的,zz
只有6个匹配的控件和10个匹配的处理。例如,B、a和b处理与控件N匹配,依此类推。要获得匹配的数据,请使用match.data(zz)
.
从上面的答案中可能不清楚的一个重要细节是 matchit 包(以及任何领域的许多学术文献中)的默认匹配形式是使用倾向得分,该得分估计每个观察的概率在给定一组使用逻辑回归的治疗前协变量的情况下分配治疗。
虽然 matchit 中默认的一对一最近邻倾向得分匹配方法将选择与给定处理观察距离最小的控制观察,但结果匹配的数据并没有按照提问者想象的方式配对。基于 logit 的倾向评分方法将多维预处理数据折叠为一维零到一尺度,并为处理过的观察确定适当的控制。最终结果通常是处理组和控制组的倾向得分重叠较大,但如果在匹配的那个阶段,处理组和控制组的倾向得分可能相距较远,一个遥远的控制与有问题的处理观察的距离最短(这假设匹配没有替换或 matchit 语法中的 replace=FALSE)。因此,使用 matchit 的默认设置 (method="nearest", distance="logit") 无法保证将产生匹配的群组,其中每个处理单元与特定控制单元紧密配对。如果使用 matchit 的 caliper 特征(例如,caliper=.1),那么匹配的处理单元和控制单元将始终在彼此之间的 caliper 距离内,更接近于成对的群组。) 将产生一个匹配的队列,其中每个处理单元与一个特定的控制单元紧密配对。如果使用 matchit 的 caliper 特征(例如,caliper=.1),那么匹配的处理单元和控制单元将始终在彼此之间的 caliper 距离内,更接近于成对的群组。) 将产生一个匹配的队列,其中每个处理单元与一个特定的控制单元紧密配对。如果使用 matchit 的 caliper 特征(例如,caliper=.1),那么匹配的处理单元和控制单元将始终在彼此之间的 caliper 距离内,更接近于成对的群组。
当 matchit 将距离设置为 'mahalanobis' 时,不仅距离计算不同,而且它使用卡尺之类的东西进行操作,因此成对的处理单元和控制单元看似接近。因此,使用上面的 distance='mahalanobis' 可以创建一个匹配的处理组和对照观察组。
要查看通过 logit 与通过 mahalanobis 距离计算距离时最近邻匹配有何不同的视觉表示,请参阅 matchit 包的合著者之一 Gary King 的这些幻灯片:http: //gking.harvard.edu/presentations /simplifying-matching-methods-causal-inference-1
同样重要的是要注意 PS 匹配不是配对匹配,因此,不需要使用条件逻辑回归/聚类等来尝试考虑数据的“配对性质”,这与配对不同匹配。这是分布假设,期望 PS 模型中包含的协变量的分布在治疗组和未治疗组之间是平衡的。
但是,当使用替换进行匹配时,受试者的权重将不同于 1,因此应将权重视为治疗加权的逆概率 - 匹配是加权的一种特殊情况。