赫克曼样本选择

机器算法验证 回归 计量经济学 概率 赫克曼
2022-04-17 13:19:49

http://jenni.uchicago.edu/Oxford2005/four_param_all_2005-08-07_csh.pdf的第 9 页上 ATE - 平均治疗效果是随机个体参与计划的预期收益。例如,评估上大学对工资的影响。

由于选择偏差估计步骤是:

  1. Probit,对个人上大学的概率进行建模。计算两个不同的逆米尔斯比率。

  2. 对于那些上过大学的人,对解释变量(如性别等)做 OLS,对那些没有上过大学的人做同样的事情。对于每个 OLS 回归,包括从步骤 1 中获得的适当逆米尔斯比率作为附加解释变量。

  3. ATE on 是使用大学和非大学组的参数估计的预测值差异的平均值。

我的问题是:

  1. 在第 3 步中,是否不需要对预测中使用的逆米尔斯比率使用参数估计?我只是删除了计算 ATE 的这些系数。

  2. 我是否需要在大学组和非大学组中保持 OLS 中的变量相同?如果我为大学和非大学群体拟合 OLS,则不同的变量将在解释收入变化方面发挥重要作用。因此,当我计算 ATE 时,一些参数估计值将为零。

  3. 我决定将自变量分成两组,一组用于概率,另一组用于 OLS。在 OLS 中,如果我将逆米尔斯比率与 Probit 中使用的变量一起使用,则存在高度的多重共线性。即使在存在多重共线性的情况下获得了无偏估计,我也担心由于膨胀的标准误差而导致的预测和宽置信区间。

1个回答
  1. 答案是肯定的,你不需要使用逆米尔斯比率的参数。但是您必须将它们包含在回归中,否则您的其他参数将有偏差。

  2. 根据文章是的。尽管如果不同的变量在不同的回归中具有统计显着性,则没有问题。只需假设非显着回归变量的系数为零。

  3. 拆分是完全合理的。由于您正在拟合两个模型,一个用于决定是否上大学,另一个用于对数收入,因此假设不同的变量很重要是完全合理的。不过,我应该进一步研究这一点,据我所知,在 probit 和 ols 回归中使用相同变量时的高多重共线性并不是 Heckman 模型的标准特征。