我有一个多元回归模型,可以使用 OLS 或 GLS 进行估计。GLS 的权重是外生估计的(权重的数据集与模型的数据集不同)。我试图通过查看系数、t-stats、f-stat、、...来确定一种估计技术是否比另一种“更好”。我想这是一个关于重量的问题。如果我有多组权重(包括制服),我该如何选择能够给出“最佳”估计的组?
如何确定 GLS 是否比 OLS 有所改进?
机器算法验证
最小二乘
加权回归
广义最小二乘法
2022-03-25 14:21:00
1个回答
OLS 和 GLS 之间的真正区别在于对模型的误差项所做的假设。在 OLS 中,我们(至少在 CLM 设置中)假设,其中 I 是单位矩阵 - 这样就没有不同于零的非对角线元素。对于 GLS,情况不再如此(可能是,但 GLS = OLS)。对于 GLS,我们假设,其中是方差-协方差矩阵。
许多教科书介绍 GLS 和 WLS,这是消除异方差(或试图消除)的 GLS 函数。这意味着通常的 t/F 统计数据对 GLS 估计有效,但对 OLS 无效。今天这不那么麻烦了,因为您可以只计算稳健的方差估计并以此为基础进行推断 - 就像您通常所做的那样。
这意味着 OLS 和 GLS 之间的差异在于估计的方差。真正的原因是,选择 GLS 而不是 OLS 确实是为了获得渐近效率(n的方差较小。重要的是要知道 OLS 估计可以是无偏的,即使基础(真实)数据生成过程实际上遵循 GLS 模型。如果 GLS 是无偏的,那么 OLS 也是如此(反之亦然)。
您可以很容易地证明这一点,但基本上一致性/无偏性的假设根本不依赖于估计的方差。更微妙的一点是,除非您知道实际的 GLS 函数,否则它不是无偏的,而只是一致的。
因此,我认为基于估计和在 OLS 和 GLS 之间进行选择是错误的思考方式。OLS 和 GLS 的估计应该彼此接近,如果不是在数字上,那么在“影响”的大小上。如果不是,那么很可能表明您有一个函数形式错误指定,其中您遗漏了变量。
我不知道在您的情况下排除 GLS 权重协变量是否合理 - 但也许值得尝试将它们包括在 OLS 估计中,看看会发生什么?它可能会让读者对你的结论不那么“怀疑”(但这纯粹是我的猜测)。