在http://jenni.uchicago.edu/Oxford2005/four_param_all_2005-08-07_csh.pdf的第 9 页上 ATE - 平均治疗效果是随机个体参与计划的预期收益。例如,评估上大学对工资的影响。
由于选择偏差估计步骤是:
Probit,对个人上大学的概率进行建模。计算两个不同的逆米尔斯比率。
对于那些上过大学的人,对解释变量(如性别等)做 OLS,对那些没有上过大学的人做同样的事情。对于每个 OLS 回归,包括从步骤 1 中获得的适当逆米尔斯比率作为附加解释变量。
ATE on 是使用大学和非大学组的参数估计的预测值差异的平均值。
我的问题是:
在第 3 步中,是否不需要对预测中使用的逆米尔斯比率使用参数估计?我只是删除了计算 ATE 的这些系数。
我是否需要在大学组和非大学组中保持 OLS 中的变量相同?如果我为大学和非大学群体拟合 OLS,则不同的变量将在解释收入变化方面发挥重要作用。因此,当我计算 ATE 时,一些参数估计值将为零。
我决定将自变量分成两组,一组用于概率,另一组用于 OLS。在 OLS 中,如果我将逆米尔斯比率与 Probit 中使用的变量一起使用,则存在高度的多重共线性。即使在存在多重共线性的情况下获得了无偏估计,我也担心由于膨胀的标准误差而导致的预测和宽置信区间。