从 2016 年 1 月 5 日至 2017 年 5 月 31 日,每天有 96 次能源消耗观察。我正在尝试使用 R 中的 ARIMA 模型来拟合这些时间序列观察结果。我选择时间序列的频率为 96。总共有 38016 个观测值。我已经使用tsclean
R 中的命令清理了该系列以删除异常值。
timeseries <- ts(full$consumption, frequency = 96)
净化时间序列:
timeseries <- tsclean(timeseries)
然后我区分了这个系列:
diffts <- diff(timeseries)
然后我分解了该系列以从中获取季节性成分。从中减去季节性成分以使其去季节化。
difftscomponent <- decompose(diffts)
adjusted_diffts <- diffts - difftscomponent$seasonal
最终时间序列的 ACF 图:
acf(adjusted_diffts)
最终时间序列的 PACF:
pacf(adjusted_diffts)
有三个问题:
通常,ACF 的 X 轴和时间序列的 PACF 图将显示从 1 到 ... 的滞后顺序。将有整数值指示滞后数。那么为什么在我的情况下会有十进制值 0.1.... ?这说明什么?如何获得滞后数?
通过查看 ACF 和 PACF 图,在我的情况下,AR 和 MA 的可能顺序是什么?
我已经改变了原始的时间序列,即使其静止并对其进行去季节化以适应 ARIMA 模型。通过查看最终调整后的时间序列,是否可以说它适合建模或者是否需要进一步的转换?