IV分位数回归文献

机器算法验证 回归 参考 计量经济学 工具变量 分位数回归
2022-01-28 19:27:52

在过去的几个月里,为了准备今年夏天的硕士论文,我深入阅读了有关分位数回归的内容。具体来说,我已经阅读了 Roger Koenker 2005 年有关该主题的大部分书籍。现在,我想将现有知识扩展到允许工具变量 (IV) 的分位数回归技术。这似乎是一个活跃的研究领域,正在快速发展。

也许有人可以向我建议:

  • 关于 IV 分位数回归的论文或其他文献
  • 这些不同统计技术的简短概述
  • 不同技术的优缺点

我主要是在寻找文献来帮助我入门,并对那里有什么有一个很好的了解。所以第一点很重要。有第二个和第三个就好了!此外,我的兴趣主要在于横截面方法,但也欢迎面板方法。

提前致谢。

3个回答

即使这个问题已经有了一个公认的答案,我想我仍然可以为此做出贡献。Koenker (2005) 的书真的不会让你走得太远,因为 IV 分位数回归的发展在那个时候开始回升。

早期的 IV 分位数回归技术包括Chesher (2003)的因果链框架,该框架在Ma 和 Koenker (2006)的加权平均偏差方法 (WAD) 中得到进一步发展在本文中,他们还介绍了控制变量方法。Lee (2007)使用了类似的想法,他使用控制函数推导出了 IV 分位数回归估计量。
所有这些估计器都使用了识别所必需的假定三角误差结构。这样做的问题是,这种三角形结构对于由于同时性而出现的内生性问题是不可信的。例如,您不能将这些估计量用于供需估计问题。

Dimitriy V. Masterov 提到的 Abadie、Angrist 和 Imbens (2002) 的估计器假设您同时拥有二元内生变量和二元工具。一般来说,这是一个非常严格的框架,但它将 LATE 方法从线性回归 IV 扩展到分位数回归。这很好,因为许多研究人员,尤其是经济学研究人员,都熟悉 LATE 概念和结果系数的解释。

Chernozhukov 和 Hansen (2005) 的开创性论文真正开启了这一文献,这两个人在这方面做了很多工作。IV 分位数回归估计器 (IVQR) 在分位数上下文中提供了与 2SLS 估计器的自然链接。正如 Dimitriy 指出的那样,他们的估计器是通过 Matlab 或 Ox 实现的,但您可以忘记 Kwak (2010) 的论文。这篇论文从未发表在 Stata 期刊上,而且他的代码也无法正常运行。我假设他放弃了这个项目。相反,您应该考虑Kaplan 和 Sun (2012)
的平滑估计方程 IVQR (SEE-IVQR) 估计器. 这是一个最近的估计器,它在计算速度(它避免了繁琐的网格搜索算法)和均方误差方面对原始 IVQR 估计器进行了改进。Matlab 代码可在此处获得。

Frölich 和 Melly (2010) 的论文很好,因为它考虑了条件分位数回归和无条件分位数回归之间的差异。一般来说,分位数回归的问题在于,一旦在回归中包含协变量,解释就会发生变化。在 OLS 中,您始终可以通过迭代期望定律从有条件期望变为无条件期望,但对于分位数,这是不可用的。这个问题首先由Firpo (2007)Firpo 等人提出。(2009). 他使用重新居中的影响函数来边缘化条件分位数回归系数,以便可以将它们解释为通常的 OLS 系数。出于您的目的,这个估计器不会有太大帮助,因为它只允许外生变量。如果您有兴趣,Nicole Fortin 在她的网站上提供了 Stata 代码。

我所知道的最新的无条件 IV 分位数回归估计器是Powell (2013)的。他的广义 (IV) 分位数回归估计器允许您在存在内生性的情况下估计边际分位数处理效果。在兰德网站的某个地方,他还提供了他的 Stata 代码,但我现在找不到。既然你要求它:在之前的一篇论文中,他已经在面板数据上下文中实现了这个估计器(参见Powell,2012 年)。这个估计器很棒,因为与之前所有的面板数据 QR 方法不同,这个估计器不依赖于大的 T 渐近线(你通常没有,至少在微观计量数据中没有)。

最后但同样重要的是,一个更奇特的变体:Chernozhukov 等人的审查 IVQR 估计器 (CQIV)。(2011)允许照顾审查数据 - 顾名思义。它是 Chernozhukov 和 Hong (2003) 论文的扩展,我没有链接,因为它不适用于 IV 上下文。这个估计器的计算量很大,但如果你已经审查了数据并且没有其他方法可以解决它,那么这就是要走的路。Amanda Kowalski 已在她的网站上发布了 Stata 代码,或者您可以从RePEc下载它. 这个估计器(顺便说一下,还有 IVQR 和 SEE-IVQR)假设您有一个连续的内生变量。我在收入回归的背景下使用了这些估计器,其中教育是我的内生变量,取值在 18 到 20 之间,因此不完全连续。但在模拟练习中,我总能证明这不是问题。但是,这可能取决于应用程序,因此如果您决定使用它,请仔细检查它。

我会看看7 Chernozhukov 和 Hansen IVQR 论文。2005 年的论文经常被引用。它们还提供指向 MATLAB、OX 和 Stata 中的数据和代码的链接。

该文献中另一篇经常被引用的论文是Abadie、Angrist 和 Imbens (2002)

Frolich and Melly (2010)Kwak (2010)也值得一试,特别是如果您使用 Stata。两者都提供代码。

的分位数回归手册有两个关于这些主题的优秀章节: