区分独立同分布时间序列

机器算法验证 时间序列 分布 有马
2022-03-25 11:48:31

为什么要区分正常的独立同分布时间序列X, 生成负相关序列Y?

> Acf(rnorm(5000, 0, 40))
> Acf(diff(rnorm(5000, 0, 40)))

在此处输入图像描述

在查看我想使用 ARIMA 模型预测的时间序列时,我偶然发现了这个问题。从情节来看,原始系列似乎是非平稳的,所以我决定在滞后 1 处应用差异并检查 acf/pacf。这似乎表明一个 MA(1) 模型,但显然我缺少一些东西。

在此处输入图像描述

2个回答

如果我正确理解您的评论,那么您已经过分区分了,这在各种指南中都有所讨论

编辑:根据定义和设计,您的原始数字系列 ( rnorm(5000, 0, 40)) 在相邻数字或每个第二个数字或每个第三个数字之间没有关系。它是“随机的”(伪随机,但我们这些凡人无法与真正的随机区分开来)。所以你计算的 ACF 是随机垃圾。

但是差分采用该系列数字并创建一个新系列,该系列以特定的确定性方式相关:相邻值的减法。考虑您的初始随机数系列:(n1,n2,n3,...), 然后对其进行差分得到(d1,d2,...). 两个都d1d2计算使用n2,所以您现在已经在滞后 1 处引入了自相关。

现在看看滞后 1 会发生什么。n2用于计算d1d2,一次减去一次,一次减去一次。[Begin I'm-way-in-over-my-head part.] 为了d1d2要有相同的标志,我们需要有n1<n2n2<n3(反之亦然),这比替代方案更不可能,因此我们预计自相关将为负。[结束我的头部分,大口喘气。]

有点晚了......但是,回顾一下斯卢茨基效应,其中 iid 值的线性(加权)组合导致一系列具有自相关结构的序列。这就是为什么突然假设任何过滤器纠察队都是危险的。X11-ARIMA 假设一个 16 个周期的等加权平均值(您可以将 16 更改为另一个整数)以平滑序列,而不知道假设过滤器的影响。分析万岁!