工具变量的关键假设是不可检验的吗?

机器算法验证 工具变量
2022-04-16 18:15:30

关键假设:IV 独立于响应变量 Y,无法通过经验进行检验,只能在理论上进行论证。这是真的?为什么?

当我们使用多个工具变量(例如遗传变异)时,为什么这是一个问题?

4个回答

在像 这样的回归 中,其中是内生变量,使得,“好的”工具必须满足两个条件,它们是

Yi=α+βXi+ηi
XiCov(Xi,ηi)0

  1. Cov(Xi,Zi)0,意味着该工具必须与内生变量相关,即存在第一阶段
  2. Cov(Zi,ηi)=0,这意味着该工具与结果或任何其他未观察到的决定因素的影响仅通过内生变量ZiYiXi

在特定类型的模型(即线性常数效应模型)中调用了工具与结构误差之间独立性的更强假设。独立性还意味着仪器和误差不相关,但反之则不正确。您可以在下图中可视化排除限制的想法:

ZXYη

测试排除限制的根本问题是它涉及到永远无法观察这就是为什么你不能正式地测试这个限制,无论是用一个仪器还是用一千个仪器。因此,为了激发排除限制,我们通常需要依赖于所调查关系的良好理论基础。η

话虽如此,您可能不想使用 1000 台仪器,因为重要的是仪器的质量而不是数量。有两个不同的问题,一个与许多工具下工具变量方法的不一致有关,通常与工具薄弱的问题有关。例如,请参阅有关该主题的本讲座

首先,正如其他人所说,您所说的假设是不正确的。

标准 IV 模型由下式给出,

在此处输入图像描述

这里的关键假设是没有影响,除非通过之间没有共同的原因(独立限制,或的不混杂性)。ZYXZYZ

由于我们说除了通过之外不会影响,因此认为我们可以检查是否独立于为条件来检验该假设似乎是合理的。然而,以为条件会打开碰撞路径之间产生虚假关联也就是说,即使没有直接影响,我们仍然会看到与以为条件的ZYXZYXX ZXYZYZYZYX.

话虽如此,排除限制假设不可测试并不完全正确。尽管该模型没有隐含的条件独立性,但如果变量是离散的,IV 模型确实具有可检验的含义,以不等式的形式。这些通常被称为 “工具性不平等”。要了解更多信息,我推荐Pearl的原始论文和 Swanson 及其同事最近的评论

正如您所说,该假设不正确。正确的版本是:工具 I 独立于给定协变量X 的结果 Y。这称为排除限制。如果忽略协变量,则 Y 应该依赖于 I(否则链接 I -> X 或链接 X -> Y 丢失)。

[删除了这个答案的其余部分 - jabberwocky 是正确的]

[我赞同 Rob 关于修改独立性声明的澄清,但我不同意他关于测试排除限制的声明。]

无法测试排除限制。如果研究人员施加额外的假设,一些测试是可能的,但作为一般规则,不能测试排除限制。以下陈述旨在作为一般陈述。

IV 回归的第一阶段是可测试的,有时称为包含限制您的仪器 ( I ) 是否影响您的治疗 ( T )?这可以通过 F 检验进行测试。这用于测试您的工具是强还是弱。

但是您无法测试排除限制,即您无法测试从IY的唯一路径是否穿过T ( I -> T -> Y不是 I -> Y不是 I -> e -> Y,其中e是您的错误术语)。您无法测试排除限制的原因与您最初寻找工具的原因相同:TY之间的关系被一些错误或不可观察的因素所混淆。因此,任何测试之间的条件独立性控制T的IY将被相同的错误或不可观察的因素混淆。

那么,你如何为乐器进行论证呢?论证从你的工具 ( I ) 到你的结果 ( Y )存在似是而非的因果路径需要大卫弗里德曼所说的“鞋革”:对主题的深入了解,以开发细致的研究设计并消除竞争性解释。也就是说,通过使用 IV 回归,您提出了一个自然实验。自然实验不依赖于统计测试,而是依赖于断言你已经找到了一些消除混淆的看似随机的过程。

参考:“统计模型和鞋革”,David Freedman,1991 年。