我试图估计 R 中的倾向得分。我的意思是我试图估计个人选择接受治疗的概率,其中选择接受治疗是一个二元变量。通常人们使用 logit 或 probit 来估计这些。我正在考虑使用回归树。
可以使用 rpart "anova" 方法来估计倾向吗?我认为我不能使用分类树,因为这会给出二元结果,而我想要连续倾向评分函数,即随着连续解释变量的变化,治疗概率如何变化。
我正在使用以下命令,其中 x 和 z 是连续解释变量,d 是二元处理变量,每个人都观察到所有 3 个变量,我想估计 P(D=1|X,Z)。
cart = rpart(d~x+z, data=data, method="anova")
data[,pz_c:=predict(cart, type = "vector")]
其中第一个命令估计倾向,第二个命令将预测的倾向添加到每个人的数据集中。
我最初在stackoverflow上发布了这个,并被告知在这里发布你的问题。