假设我建立了一个广义最小二乘模型。我遵循标准程序并首先估计一个 LM 模型。然后我根据这个模型的残差创建一个误差响应协方差矩阵。现在我再次构建了一个 LM 模型,只是这次我根据误差响应协方差矩阵指定了权重。
现在假设我想用样本外的 GLS 模型进行预测以测试模型的稳定性。我想确认我可以使用 GLS 估计的系数简单地执行预测,并且不再需要提供权重(特别是因为在残差不可用的预测场景中,无法生成误差响应协方差矩阵)。
后续问题:
我们继续使用来自训练数据的系数对测试数据进行评分。(测试数据的维度由 N 个个体的横截面和 T 个观察值组成。)我们希望产生一致的标准误差。因此,我们不是以 OLS 方式计算估计的标准误差,而是通过“GLS 权重”向量对残差(见下文)进行加权:
SEE 的 OLS 计算:sqrt( sum( ( residuals from linear model ) ^ 2 ) ) / residualDegreeFreedom )
SEE 的 GLS 计算:sqrt( sum( ( residuals from linear model) ^ 2 * glsWeight ) ) / sum( glsWeight ) * length( glsWeight ) / residualDegreeFreedom )
“gls weight”是以通常方式计算的向量,作为在某一日期的每个横截面的残差的方差的倒数(即长度为T的向量)。但是,这里我使用的是来自测试数据的残差,而不是训练数据(实际上这是必需的,否则超时残差的维度将与 GLS 权重向量的维度不匹配)。
违反直觉的是,如果我想在一个人的样本外测量 GLS 模型的 SEE,我需要在样本外对所有个体进行评分(否则构建 GLS 权重向量将是不可能的,因为有没有残差方差)。
问题是 - 在计算 SEE 样本外时我是否需要使用 GLS 权重,或者我可以简单地使用 SEE 的 OLS 计算?