2SLS 但第二阶段 Probit

机器算法验证 状态 概率 工具变量 2sls
2022-01-18 04:44:26

我正在尝试使用工具变量分析来推断观察数据的因果关系。

我遇到了一个两阶段最小二乘 (2SLS) 回归,它很可能解决我研究中的内生性问题。但是,我想第一阶段成为 OLS,第二阶段成为 2SLS 中的概率。根据我的阅读和搜索,我看到研究人员使用 2SLS 或第一阶段概率和第二阶段 OLS,但不是相反,这是我想要实现的。

我目前正在使用 Stata,而在 Stata 中的ivreg命令用于直接 2SLS。

1个回答

你的情况比相反的问题要少。期望和线性投影算子经过线性的第一阶段(例如 OLS),但不是通过非线性的,例如 probit 或 logit。因此,如果您首先回归您的连续内生变量,这不是问题X在您的乐器上Z,

Xi=a+Ziπ+ηi
然后在概率第二阶段使用拟合值进行估计
Pr(Yi=1|X^i)=Pr(βX^i+ϵi>0)

标准错误不会是正确的,因为X^i不是随机变量,而是估计量。您可以通过同时引导第一阶段和第二阶段来纠正此问题。在 Stata 中,这将类似于

// use a toy data set as example
webuse nlswork

// set up the program including 1st and 2nd stage
program my2sls
    reg grade age race tenure
    predict grade_hat, xb

    probit union grade_hat age race
    drop grade_hat
end

// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls

在这个例子中,我们想要估计受教育年限对加入工会的概率的影响。鉴于受教育年限可能是内生的,我们在第一阶段用任期年限来衡量它。当然,从解释的角度来看,这没有任何意义,但它说明了代码。

只要确保在第一阶段和第二阶段使用相同的外生控制变量。在上面的例子中,那些是age, race(非感官的)仪器tenure只存在于第一阶段。