增强 AR 用于时间序列预测?

机器算法验证 时间序列 预测 自回归的
2022-03-21 01:44:09

我在多个位置记录了时间序列数据,存储在矩阵中。我已经为它拟合了一个向量自回归模型,它可以很好地预测测试集上的数据。但是,如果我绘制残差,肯定会留下一些时间序列结构;理想情况下,残差看起来像噪音。 Y

我一直在学习增强树(R 中的包 'gbm'),它将响应向量拟合到某些输入特征,拉出残差,然后再次拟合到相同的输入特征(重复直到过程开始过度拟合)。我相信一棵树不能很好地模拟时间序列结构,所以我想知道是否可以使用 AR 模型作为弱学习器来完成相同的过程。YXE=Yf(X)EX

在拟合我的 VAR 模型后,我获取残差并为其拟合 AR 过程,并使用 R 中的“预测”包对其进行预测。然后我将我的 VAR 预测添加到我的 AR 预测中以获得最终预测。某些位置的误差会减少,但对于大多数位置,误差会增加。

下面是仅适合 VAR 模型的残差图 - 肯定有一些结构仍然可以使用某些模型来解释。有什么建议么?

更新: 时间序列代表不同位置的能源消耗。在夜间,我们预计能源消耗会非常低且平稳,白天可能会有高波动性,因此差异肯定不是恒定的。我的第一步是使用 STL(使用黄土进行季节性趋势分解)去除每日季节性成分。之后,我将我的 VAR 模型拟合,然后将另一个 AR 模型拟合到残差。移除季节性组件后的时间序列如下所示:

在此处输入图像描述

来自 VAR 的错误项看起来像

VAR 错误

2个回答

您可以查看 Souhaib Ben Taieb 和 Rob J. Hyndman 的论文“提升多步自回归预测(链接不起作用)”。或直接在 Hyndmans 网站Boosting multi-step autoregressive predictions 。

主要思想是使用梯度提升方法来提升传统的自回归(线性)模型。

您可能需要在 AR 公式中包含一些非线性回归量。因此,不是仅将向量针对某些 ( ) 回归(这给出标准 AR),而是针对回归( ) 甚至 ( )。要获得最有用的结果,您可能需要使用子集选择来识别最有用的非线性项。(向量上的所有操作都逐点进行,但您也可以考虑不同分量的乘积。)xt+1xtii=0,1,...xtixti2i=0,1,...xtixtjij