即使这个问题已经有了一个公认的答案,我想我仍然可以为此做出贡献。Koenker (2005) 的书真的不会让你走得太远,因为 IV 分位数回归的发展在那个时候开始回升。
早期的 IV 分位数回归技术包括Chesher (2003)的因果链框架,该框架在Ma 和 Koenker (2006)的加权平均偏差方法 (WAD) 中得到进一步发展。在本文中,他们还介绍了控制变量方法。Lee (2007)使用了类似的想法,他使用控制函数推导出了 IV 分位数回归估计量。
所有这些估计器都使用了识别所必需的假定三角误差结构。这样做的问题是,这种三角形结构对于由于同时性而出现的内生性问题是不可信的。例如,您不能将这些估计量用于供需估计问题。
Dimitriy V. Masterov 提到的 Abadie、Angrist 和 Imbens (2002) 的估计器假设您同时拥有二元内生变量和二元工具。一般来说,这是一个非常严格的框架,但它将 LATE 方法从线性回归 IV 扩展到分位数回归。这很好,因为许多研究人员,尤其是经济学研究人员,都熟悉 LATE 概念和结果系数的解释。
Chernozhukov 和 Hansen (2005) 的开创性论文真正开启了这一文献,这两个人在这方面做了很多工作。IV 分位数回归估计器 (IVQR) 在分位数上下文中提供了与 2SLS 估计器的自然链接。正如 Dimitriy 指出的那样,他们的估计器是通过 Matlab 或 Ox 实现的,但您可以忘记 Kwak (2010) 的论文。这篇论文从未发表在 Stata 期刊上,而且他的代码也无法正常运行。我假设他放弃了这个项目。相反,您应该考虑Kaplan 和 Sun (2012)
的平滑估计方程 IVQR (SEE-IVQR) 估计器. 这是一个最近的估计器,它在计算速度(它避免了繁琐的网格搜索算法)和均方误差方面对原始 IVQR 估计器进行了改进。Matlab 代码可在此处获得。
Frölich 和 Melly (2010) 的论文很好,因为它考虑了条件分位数回归和无条件分位数回归之间的差异。一般来说,分位数回归的问题在于,一旦在回归中包含协变量,解释就会发生变化。在 OLS 中,您始终可以通过迭代期望定律从有条件期望变为无条件期望,但对于分位数,这是不可用的。这个问题首先由Firpo (2007)和Firpo 等人提出。(2009). 他使用重新居中的影响函数来边缘化条件分位数回归系数,以便可以将它们解释为通常的 OLS 系数。出于您的目的,这个估计器不会有太大帮助,因为它只允许外生变量。如果您有兴趣,Nicole Fortin 在她的网站上提供了 Stata 代码。
我所知道的最新的无条件 IV 分位数回归估计器是Powell (2013)的。他的广义 (IV) 分位数回归估计器允许您在存在内生性的情况下估计边际分位数处理效果。在兰德网站的某个地方,他还提供了他的 Stata 代码,但我现在找不到。既然你要求它:在之前的一篇论文中,他已经在面板数据上下文中实现了这个估计器(参见Powell,2012 年)。这个估计器很棒,因为与之前所有的面板数据 QR 方法不同,这个估计器不依赖于大的 T 渐近线(你通常没有,至少在微观计量数据中没有)。
最后但同样重要的是,一个更奇特的变体:Chernozhukov 等人的审查 IVQR 估计器 (CQIV)。(2011)允许照顾审查数据 - 顾名思义。它是 Chernozhukov 和 Hong (2003) 论文的扩展,我没有链接,因为它不适用于 IV 上下文。这个估计器的计算量很大,但如果你已经审查了数据并且没有其他方法可以解决它,那么这就是要走的路。Amanda Kowalski 已在她的网站上发布了 Stata 代码,或者您可以从RePEc下载它. 这个估计器(顺便说一下,还有 IVQR 和 SEE-IVQR)假设您有一个连续的内生变量。我在收入回归的背景下使用了这些估计器,其中教育是我的内生变量,取值在 18 到 20 之间,因此不完全连续。但在模拟练习中,我总能证明这不是问题。但是,这可能取决于应用程序,因此如果您决定使用它,请仔细检查它。