预测非平稳时间序列

机器算法验证 时间序列 预测 有马
2022-03-12 03:12:18

我想预测非平稳时间序列,涉及从研究此类序列的实例得出的几个关键的先验假设。

  1. 我已经构建了近似于正态分布的时间平均单点概率分布函数。

    p^(x)=12πσ2exp(x22σ2)
    从这个角度来看,我想要预测zt(l)不超过这个时l. 换句话说,方差zt(l)必须有界。

  2. 平均两点概率分布函数p^(xi,i;xj,j)也已经构建,这导致了自相关函数的识别。ρ(j)Ajα假如0<α<0.5.

起初,Box-Jenkins 识别过程导致我ARIMA(0,1,3)模型,然而

  1. 我不能有有限的方差,直到d0(从 BJ 权重的方程得出ψj)。同时,我无法使用d=0因为初始自相关下降缓慢(根据 BJ,这可能是非平稳性的证据)。这是我的主要障碍。

  2. 在视觉上,模拟ARIMA(0,1,3)与我的样本行为不符。并且序列的一阶差分的相关性与模型得出的相关性不一致。

  3. 残差分析显示从滞后 3 开始有显着的相关性。这就是为什么我最初声明ARIMA(0,1,3)是不正确的。

试图适应不同的ARIMA(p,0,0)模型,我发现在滞后附近存在显着的残差相关性p对于每个p. 它可能假设我需要ARIMA(,0,q)模型(作为限制选择),例如分数 ARIMA。

从 [1] 我了解了分数ARIMA(p,d,q)模型是ARIMA(,0,q)有效。

  1. 我还没有找到任何支持缺失值的 GNU R 包。缺失值似乎是一种挑战。

  2. 关于分数 ARIMA 的出版物非常罕见。真的使用了这样的分数模型吗?也许有一个很好的 ARIMA 模型替代品来满足我的需求?预测不是我的专业,我只有务实的兴趣。

  3. 从不同的文献(例如 [2])中,我了解到实际上不可能在分数 ARIMA 和具有“水平偏移”的模型之间做出决定。但是,我还没有找到适合 'level shift' 模型的 GNU R 包。

[1]: Granger, Joyeux.: J. of time series anal。卷。1 号 1 1980 年,第 15 页

[2]:Grassi, de Magistris.:“当长记忆遇到卡尔曼滤波器时:一项比较研究”,计算统计和数据分析,2012 年,出版中。

更新:呈现我自己的进步并回答@IrishStat

我关于两点概率分布的陈述通常是不正确的。以这种方式构造的函数将取决于完整的系列长度。所以,有一点可以从中提取。至少,参数名为α将取决于全系列长度。

清单 2 和清单 3 也已更新。

我的数据在此处作为 dat 文件提供。

目前,我怀疑 FARIMA 和电平转换之间的关系,我仍然找不到合适的软件来检查这个选项。这也是我对模型识别的第一次体验,因此将不胜感激。

1个回答

我从未见过像 Box-Jenkins 识别过程这样的模型让我找到了 ARIMA(0,1,3) 模型,但在我去澳大利亚之前我从未见过黑天鹅。请发布您的数据,因为它可能表明需要

  1. 干预检测导致包括电平变化、本地时间趋势等
  2. 时变参数
  3. 时变误差方差

如果您的数据是机密的,只需对其进行扩展。

好的,收到您的数据(大约 80000 个读数)后,我选择了从 6287 点开始的 805 个观察值并获得。

在此处输入图像描述. 在周期 137 检测到一个显着变化点,表明参数随时间变化。剩下的 668 个观察结果表明一个 pdq ARIMA 模型 (3,0,0) 具有一个 level.step shift 支持您关于滞后 3 的初步结论在此处输入图像描述实际/拟合/预测图是在此处输入图像描述残差图在此处输入图像描述,残差的 acf 是在此处输入图像描述由于残差的 acf 在周期 5 和 10 显示出强大的结构, 在此处输入图像描述您可以进一步研究滞后 5 的季节性结构。我希望这会有所帮助。