您将如何拟合具有大量自相关的 ARIMA 模型?

机器算法验证 有马
2022-03-30 03:10:15

这真是令人费解……

我有这个有很多自相关的数据......

数据为15min数据约60000个数据点。

我尝试用平均模型 ARMA(6, 6) 将其拟合到 ARIMA(6, 0, 6) 甚至 GARCH(1, 1),但残差中仍然存在很多自相关。 在此处输入图像描述 我几乎想尝试 ARIMA(100,0,100),但我认为这还不够……

我在 R 中做这些。

我如何走出这片沼泽?请给我一些启发。

非常感谢

更新:我使用“rugarch”包在 R 中安装了一个带有分布“sstd”的 gjrGARCH 模型......

标准化残差的 QQ 图看起来很棒——它是一条直线……

然而,残差和残差平方的 ACF 图有点奇怪,尤其是残差平方 ACF 图中的大尖峰。

谁能给我们一些启发,尤其是关于那个大尖峰?

谢谢!

在此处输入图像描述

在此处输入图像描述

2个回答

我认为这里的问题是残差的假设检验是否合适。您有 60000 个观测值,因此任何模型都将无法通过残差检验,因为数据太多。这并不会使模型变坏,它只是意味着您有足够的数据能够判断该模型是对现实的不准确表示。

退一步问,你想要一个模型做什么?您对有助于选择合适模型的数据了解多少?无论您最终使用哪种模型,都不要期望发现残差是白噪声。有了足够的数据,每个模型都可以证明是不充分的。

我们正在为一家大型快餐连锁店处理此类数据。该系列代表过去 5 年(180,000 次观察)中每隔 15 分钟对炸玉米饼的需求。可以通过为每 15 分钟间隔构建 96 个单独的模型 (4x24) 来处理该系列,该模型反映了每日值的总体趋势、水平变化、假日效应等。通过整合每日值及其历史对 96 个模型中的每一个模型的影响,然后进行协调,我们能够准确预测 15 分钟间隔的需求和每日总数。您认为 acf 很重要的原因是 Rob 指出的样本量,因为 acf 的标准误差等于 1/sqrt(N)。

@Luna正如您在评论中正确指出的那样,一个人失去了不同时间片之间的联系,但一个人在几天/几周/几个月内获得了活动的影响,同时能够检测到日常影响的变化,同时发现特定日期的影响月等。我们像您一样研究了使用半小时电力需求数据的“一次性序列方法”,只是得出结论,由于数据的大小/长度,我们得到了错误的结论。一般来说,一个可以有 96 个具有 X eXogenous series 的方程。这将被称为向量 ARIMA 问题,并且会因为异常值/inliers cpuld 扭曲参数估计而变得笨拙。由于 N 大,标准误差在尺寸上是微观的。我们找到了将每日趋势直接纳入 96 个方程的方法