我有个人的纵向数据集,其中一些人接受了治疗,而另一些人则没有。所有个体从出生到 18 岁都在样本中,并且治疗发生在该范围之间的某个年龄。治疗的年龄可能因病例而异。使用倾向得分匹配,我想将治疗和控制单位成对匹配,并在出生年份进行精确匹配,这样我就可以跟踪每一对从出生年份到 18 岁的情况。总而言之,大约有 150 名接受治疗和 4000 名未经治疗的人。匹配后的想法是使用差异中的差异策略来估计治疗效果。
我目前面临的问题是与面板数据进行匹配。我正在使用 Stata 的psmatch2
命令,并使用倾向得分匹配来匹配家庭和个人特征。一般来说,对于面板数据,每个年龄都会有不同的最佳匹配。例如:如果 A 被处理,B 和 C 是对照,并且他们都是 1980 年出生的,那么 A 和 B 可能在 1980 年匹配到 0 岁,而 A 和 C 在 1981 年匹配到 1 岁,依此类推. A 也可以与其前几年的预处理值相匹配。
为了解决这个问题,我取了所有随时间变化的变量的平均值,以便匹配可以识别在样本期间平均最相似的个体,并且我对 0 到 18 岁的每个年龄组分别进行匹配。不幸的是,这仍然将不同的控制单元与每个年龄组的每个处理单元匹配。
如果有人可以指导我找到一种与 Stata 中的面板数据进行配对匹配的方法,我将不胜感激。