违反高斯-马尔可夫假设

机器算法验证 回归 自习 假设
2022-04-17 07:12:03

这张图中违反了哪个高斯-马尔可夫假设?

如果满足所有其他 Gauss-Markov 假设,则的 OLS 估计量是否无偏且一致?为什么?β1

图表你和收入

图中,u是误差项,Einkommen收入(解释变量)。

模型指定如下:

y=β0+β1einkommen+u

这个问题来自考试。

我的想法(x 是 einkommen):

该图显示了一个二次函数

Gauss-Markov 假设是:
(1) 参数线性
(2) 随机抽样
(3) x 的抽样变化(并非所有相同的值)
(4) 零条件均值 E(u|x)=0
(5) 同方差

我认为(4)是满足的,因为0上下都有残差

(5) 满足,因为在所有 x (3) 满足的情况下变化似乎是恒定的,因为 einkommen 对于所有观察值都不相同 (2) 随机抽样满足,不要问我为什么。所以只剩下 (1),模型的参数不是线性的。

我希望我的想法不是完全错误的。

4个回答

有几个答案,但没有一个人提到我认为最有趣的问题,错误指定的线性模型的偏差和一致性。由于从残差中可以清楚地看出模型被错误地指定为二次项,让我们来看看我们的估计会发生什么。我将把它放在一个一般的错误规范方面,而不是仅仅为了有趣而使用二次方。

假设我们知道一个预言机告诉我们数据的生成过程是但是,我们选择拟合的模型是形式的额外参数。现在,我们可以将 Z 视为我们无法或选择不收集的数据,但我们也可以将 Z 项视为我们收集并选择不包含在模型中的数据(例如您所处的情况)。Y=Xβ+Zα+ϵY=Xβ+ϵα

现在典型的参数估计是偏见与我们估计的期望有关,如果我们想要保持一致性,我们需要我们的偏见渐近消失。牢记这一点,我们看看我们的期望:β^=(XTX)1XTYE[β^]=(XTX)1XTE[Y]=β+(XTX)1XTZα

因此,如果我们指定错误,并且 alpha 不是一列 0,我们最终得到的估计肯定会受到的一个因素的影响。同样,由于一致性取决于渐近无偏性,并且我们的偏差项没有理由渐近消失,我们可以预期参数估计不能很好地保持一致。(XTX)1XTZα

您的数据似乎不遵循线性模型。

首先请注意,数据看起来具有二次关系而不是线性关系。这对线性假设产生了怀疑:

E[Y|einkommen]=β0+β1einkommen

我给你的提示是:相反,假设模型是线性的,执行回归(假设或字面上)而不是检查其他假设,它们是否成立?

额外提示:并不意味着对于所有E[u]=0E[ui|einkommeni]=0i

主要问题是假设#5,即同方差性。您的误差方差似乎随收入而变化。中间比两端高。