我看到了一个回归模型,该模型正在回归滞后(12 个月)相同股票指数的同比回报、信用利差(无风险债券和公司债券的月均值之间的差异)产率)、同比通货膨胀率和工业生产同比指数。
它看起来是这样的(尽管在这种情况下您将替换特定于印度的数据):
SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)
SP500YOY 是 SP500 指数的同比回报 要计算这一点,计算 SP500 值的月平均值,然后转换为每个月的同比回报(即 2010 年 1 月至 2011 年 1 月,2010 年 2 月至2011 年 2 月、2010 年 3 月至 2011 年 3 月……)。在解释变量方面,SP500YOY 的 12 个月滞后值与时间 T 的 CREDITSPREAD 以及未来两个时期的通货膨胀和工业生产一起使用。INFLATIONASYMM 是通胀是否高于 5.0% 阈值的虚拟变量。括号中的索引显示了每个变量的时间索引。
这是通过标准 OLS 线性回归估计的。要使用此模型预测 SP500 的 1.2 和 3 个月的同比回报,必须对通货膨胀和工业生产指数生成 3.4 和 5 个月的提前预测。这些预测是在将 ARIMA 模型分别拟合到两者之后完成的。未来 1,2 和 3 个月的 CreditSpread 预测只是作为心理估计。
我想知道这个 OLS 线性回归是正确/不正确、高效/低效还是普遍有效的统计实践。
我看到的第一个问题是使用重叠数据。即股票指数的每日价值每月平均,然后用于计算每月滚动的年度回报。这应该使误差项自相关。我认为人们必须对以下其中一项进行一些“更正”:
- White 异方差一致协方差估计量
- Newey & West 异方差和自相关一致 (HAC) 估计器
- Hansen & Hodrick 的异方差一致版本
将标准 OLS 线性回归(没有任何修正)应用于此类重叠数据真的有意义吗?更重要的是,使用 3 期提前 ARIMA 预测解释变量以用于预测 SP500YOY 的原始 OLS 线性回归?我以前没有见过这样的形式,因此无法真正判断它,除非纠正使用重叠观察。