我正在按照本文(*.pdf) 中的说明进行匹配。我使用的数据集非常大,因此我必须从中提取一个(子)样本,才能真正到达任何地方。我在 R 中使用 MatchIt 包(与上述文章一起编写)。
我使用最近邻匹配,匹配从 logit 模型估计的倾向得分。
现在我一直在想;由于 logit 模型的估计非常快(8,000,000 obs 需要 2 分钟),并且数学搜索非常慢,是否可以并行化匹配算法?使用多个 CPU 来加快进程?
我意识到这在包装中是不可能的,就像现在一样,但它在理论上可行吗?伪代码或快速运行将不胜感激。