解释遗漏变量偏差的传统方式(至少在经济学中)包括考虑 Mincer 类型回归: 其中 LHS 表示个体 i 在时间的工资, 表示控制向量, 表示教育水平, 表示个体特定的异质性,如能力,这可能与教育有关。结果,如果我们不以某种方式“控制”能力,我们会得到的有偏估计。
现在,我遇到了一些读物,尤其是与“不良控制”有关的读物。这些读数指向的是,包含作为变量控制的变量本身可能是结果变量,可能会导致感兴趣参数的偏差。
使用这样的推理,即使我们确实有能力的衡量标准,将其包括在回归中也会指出这个问题,因为我可以想到很多原因为什么教育水平是能力的函数(诺贝尔奖得主模型由Spence 正是指向这一假设)。
在省略变量的情况下,我们假设在以下情况下可能存在问题:
• 包含的回归器和排除的回归器之间的
• 排除的回归变量是相关的。
这引出了我的问题。如果怀疑省略的变量与包含的变量有非零 cov(.),则有两种可能的情况:
一个原因另一个,导致两者之间的依赖
这两者是由第三个变量引起的。
情况 2 似乎很好,只要这第三个变量在确定时并不重要 。但是案例 1 肯定是有问题的。在我看来,在校正遗漏变量偏差问题和不良控制问题之间可能存在权衡。怎么可能调和呢?

