线性回归模型中的随机变量与固定变量

机器算法验证 回归 计量经济学 线性模型 内生性
2022-03-25 19:02:31

阅读Fumio Hayashi 的“Econometrics”,来自普林斯顿大学出版社,ISBN 0-691-01018-5,在第 13 页的“Fixed Regressors”副标题中,陈述:

“我们提出了经典的线性回归模型,将回归变量视为随机的。这与大多数教科书中的处理方式形成对比,其中 X 被假定为“固定”或确定性。如果 X 是固定的,则无需区分误差项的条件分布 [...] 和无条件分布"

我在理解这一段时遇到了问题。我认为它说如果你认为 X 是固定的,那么它是“常数”并且误差项的条件分布和无条件分布是相同的,因为“常数”上的条件分布等于无条件分布?

另一方面,我不知道为什么这是相关的,每次lmR我知道 X 运行时,它总是固定的!我在这里遗漏了一些东西......你能帮帮我吗?

1个回答

Jesper 的评论表明了正式的观点。你也是对的,假设是否X是否固定与数值估计无关,因为我们回归yX在任何一种情况下都使用相同的命令lm

然而,该假设至关重要的是对结果的适当解释特别是,当X是随机的,这开启了以下可能性E(u|X)0甚至E(Xu)0,即回归变量和错误并不意味着独立或不相关。

发生这种情况时,OLS 不再是公正的或一致的。粗略地说,我们可能不再将这些估计解释为因果效应的估计,而只是作为可能有趣或可能不有趣的相关性。

此页面上有许多提供进一步讨论的主题,请参阅例如理解和解释 OLS 的一致性省略的变量偏差:我需要包括哪些预测变量,为什么?为什么AR(1)系数的OLS估计有偏差?.

当假设不满足时,工具变量方法可以提供替代方案,请参见例如什么是工具变量?如何向外行解释工具变量