“最佳”工具的定义

机器算法验证 回归 工具变量 2sls
2022-04-03 14:11:17

我读的书(戴维森,麦金农 -计量经济学理论和方法)描述了“最佳工具变量”的定义如下:

通常,这在其他处理回归模型的教科书中很常见,我们想要估计另一种说法相同但在更一般的意义上是我们想要估计是一个信息集,包含决定结果的所有变量。E(y|X)E(y|Ω)Ωy

在工具变量估计的上下文中,我们考虑具有同方差现在假设 X 的至少一个解释变量是内生的。因此,我们想要找到一个最小化y=Xβ+uuWβIV

在这里我迷路了。假设一般可以假设满足关系其中现在应该是仪器的最佳矩阵,但我不明白应该是什么。中的所有信息,这是的预期结果,但是如果中的一个变量是内生的,我用其余变量的线性组合替换这个变量,这些变量假设是外生的那,我问自己为什么XX=X¯+VE(V|Ω)=0X¯=E(X|Ω)X¯X¯XΩXX¯X¯是一种可行的工具。为什么这个不再与相关?X¯u

我不是在寻找技术解决方案,也不是在寻找某种数学证明。我想了解这种方法背后的想法。

1个回答

我还没有阅读书中的特定页面,但这是我的看法。

X¯=E(X|Ω) 这是你的“理想”第一阶段回归。是在控制了决定 Y )之后提供信息的所有变量的集合。X¯Ω

E(V|Ω)=0 这是有效性假设。的未观察到的因素与 Y 的行列式无关。X¯

我给你举个例子,Card (1992) 用“到学校的旅行距离”来衡量“受教育年限”来确定工资回报。他假设“智力”或“能力”是一个未被控制的未被观察到的因素。因此,“教育”被认为是内生的,因为它与“能力”相关。

什么是最优工具集?它是满足戴维森和麦金农定义的集合。

虽然 Card 只使用了一种乐器,但直觉可以在这里举例说明。在第一阶段回归中,,您将回归教育“到学校的距离”以及其他任何决定工资的因素,例如年龄、成绩、经验等。如果您可以安全地假设之后这样做,,那么你就找到了合适的工具。X¯=E(X|Ω)E(V|Ω)=0

第一个假设包括整个信息集是必要的。可以想象,“到学校的距离”与“年龄”有关,而“年龄”被认为与“工资”有关,但也与“能力”有关,例如,老年人住得离学校较远的城市,但可能更少/更有能力,因为他们是不同的一代。如果不能对此进行控制,将使您的第二个假设无效。ΩE(V|Ω)=0

因此,理想的工具集需要在“部分排除”任何其他已知确定 Y 之后与您的回归相关联。