OLS 中是否存在遗漏变量偏差测试?

机器算法验证 回归 多重回归 偏见 因果关系 诊断
2022-03-13 22:34:23

我知道 Ramsey Reset 测试可能会检测非线性依赖关系。但是,如果您只是丢弃其中一个回归系数(仅仅是线性相关性),您可能会得到偏差,具体取决于相关性。这显然没有被重置测试检测到。

我没有找到针对这种情况的测试,但有以下声明:“您无法测试 OVB,除非包含潜在的省略变量”。这可能是一个合理的说法,不是吗?

4个回答

如果您有可用的工具变量,您可以在不测量遗漏变量的情况下测试遗漏变量偏差。

因此,我会稍微扩展您的陈述以给出:

除非有一个或多个工具变量可用,否则您无法测试遗漏变量偏差,除非包括潜在遗漏变量。

然而,有一些假设,其中一些在统计上无法检验,即变量是工具变量。因此,如果您没有对潜在遗漏变量的测量值,则在不做一些假设的情况下就无法避免遗漏变量偏差。

简单示例:

如果真实的关系描述为:

y=β0+β1x1+β2x2+ε

省略解释变量的回归,例如:

y=β0+β1x1+ε

如果存在遗漏变量偏差

  1. x1x2是相关的
  2. 省略的变量,x2, 对因变量 y 有影响。

因此,如果你跑y=β^0+β^1x1+ε^x2可用,您可以检查是否遗漏x2通过检查上述两个条件,导致遗漏变量偏差。但是,我认为没有任何测试可以通过仅查看回归中使用的数据来告诉您回归是否存在遗漏变量偏差。

不存在检测遗漏变量偏差的统计检验。

但是,如果您怀疑一个被忽略的变量可能会导致遗漏变量偏差,并且您有该变量的工具,那么您可以测试该特定变量的 OVB。

有关遗漏变量偏差的一般讨论,您可以查看以下站点:

https://economictheoryblog.com/2018/05/04/omited-variable-bias/

它包含一个很好的讨论,关于如何解决一般的遗漏变量偏差以及在运行回归之前应该采取哪些预防措施。

我认为省略了一些效果x2专注于的估计。其余的被残留物吸收。我认为查看是否对 y 有重要影响表明它应该在模型中的一个好方法是拟合仅包括的模型,然后绘制残差与如果存在关系而不是随机变化很重要,并且其遗漏会导致遗漏变量偏差。β0β1x2x1x2x2