我正在尝试使用工具变量分析来推断观察数据的因果关系。
我遇到了一个两阶段最小二乘 (2SLS) 回归,它很可能解决我研究中的内生性问题。但是,我想第一阶段成为 OLS,第二阶段成为 2SLS 中的概率。根据我的阅读和搜索,我看到研究人员使用 2SLS 或第一阶段概率和第二阶段 OLS,但不是相反,这是我想要实现的。
我目前正在使用 Stata,而在 Stata 中的ivreg命令用于直接 2SLS。
我正在尝试使用工具变量分析来推断观察数据的因果关系。
我遇到了一个两阶段最小二乘 (2SLS) 回归,它很可能解决我研究中的内生性问题。但是,我想第一阶段成为 OLS,第二阶段成为 2SLS 中的概率。根据我的阅读和搜索,我看到研究人员使用 2SLS 或第一阶段概率和第二阶段 OLS,但不是相反,这是我想要实现的。
我目前正在使用 Stata,而在 Stata 中的ivreg命令用于直接 2SLS。
你的情况比相反的问题要少。期望和线性投影算子经过线性的第一阶段(例如 OLS),但不是通过非线性的,例如 probit 或 logit。因此,如果您首先回归您的连续内生变量,这不是问题在您的乐器上,
标准错误不会是正确的,因为不是随机变量,而是估计量。您可以通过同时引导第一阶段和第二阶段来纠正此问题。在 Stata 中,这将类似于
// use a toy data set as example
webuse nlswork
// set up the program including 1st and 2nd stage
program my2sls
reg grade age race tenure
predict grade_hat, xb
probit union grade_hat age race
drop grade_hat
end
// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls
在这个例子中,我们想要估计受教育年限对加入工会的概率的影响。鉴于受教育年限可能是内生的,我们在第一阶段用任期年限来衡量它。当然,从解释的角度来看,这没有任何意义,但它说明了代码。
只要确保在第一阶段和第二阶段使用相同的外生控制变量。在上面的例子中,那些是age, race
(非感官的)仪器tenure
只存在于第一阶段。