为什么我的 VAR 模型在使用非平稳数据时比使用平稳数据效果更好?

机器算法验证 时间序列 预测 r平方 向量自回归 平稳性
2022-03-16 16:00:00

我正在使用 python 的 statsmodels VAR 库对金融时间序列数据进行建模,一些结果让我感到困惑。我知道 VAR 模型假设时间序列数据是固定的。我无意中拟合了两种不同证券的非平稳对数价格序列,令人惊讶的是,拟合值和样本内预测非常准确,具有相对不显着的平稳残差。样本内预测的为 99%,预测残差序列的标准差约为预测值的 10%。R2

但是,当我将对数价格进行差异并将该时间序列拟合到 VAR 模型时,拟合值和预测值相差甚远,在均值附近的狭窄范围内反弹。因此,残差在预测对数回报方面比拟合值做得更好,预测残差的标准差比拟合数据系列大 15 倍,预测系列的值为 0.007。R2

我是否误解了 VAR 模型上的拟合残差和残差,或者犯了其他错误?为什么非平稳时间序列会比基于相同基础数据的平稳时间序列产生更准确的预测?我对来自同一个 python 库的 ARMA 模型进行了很好的研究,并且没有看到像这样建模单系列数据的东西。

1个回答

两个事实:

  1. 当您在另一个随机游走上回归一个随机游走并错误地假设平稳性时,您的软件通常会吐回具有统计意义的结果,即使它们是独立的过程!例如,请参阅这些讲义。(Google 会出现虚假随机游走和大量链接。)出了什么问题?通常的 OLS 估计和标准误差是基于在随机游走情况下不正确的假设。

    假装通常的 OLS 假设适用并相互回归两个独立的随机游走通常会导致回归具有巨大的、非常显着的系数,这完全是假的!当存在随机游走并且您在水平上运行回归时,违反了 OLS 的通常假设,您的估计不会收敛为,通常的中心极限定理不适用,并且 t-stats 和 p-值您吐出的回归都是错误的。R2t

  2. 如果两个变量是协整的,您可以对另一个进行回归,并且您的估计器将比通常的回归更快地收敛,这种结果称为超一致性。例如。在线查看 John Cochrane的时间序列书并搜索“superconsistent”。