如何解释具有 ARIMA 误差的回归中的系数?

机器算法验证 时间序列 变化点 干预分析
2022-04-06 18:03:31

我有一些时间序列业务数据,我可以相对较好地与ARIMA(2,1,0)(1,1,0)[12]模型拟合(使用 R 的优秀forecast::Arima——感谢 Hyndman 教授!)。该系列主要受季节性影响,但也有趋势,因此存在差异。我不是预测专家。

我正在通过模拟某种干预的效果来探索未来的实验(功率分析之类的东西),这种干预可能会增加(或减少)系列中的值,可能是相乘的。为此,我将过去 N 个月的数字缩放 X%,并使用xreg参数将模型从差分 AR(1) 更改为具有时间序列误差的回归。我用作回归量的向量看起来像[0, 0, ..., 0, 1, 1, 1],其中 1 代表干预有效的月份。

我从模型中得到的系数似乎是一个加法效应,这是有道理的,但比实际效应小得多(4000 对 100,000)。但是,当我forecast在回归器中使用 , 带和不带 1 时,差异是预期的大小 - 如果有的话,太高了。

所以,我的问题:

  1. 我如何解释该系数。是添加剂吗?
  2. 在治疗有效的所有时间段内在回归向量中使用 1 是否正确,或者我应该将其视为抵消 ARIMA 模型中趋势的冲动,并使用类似的模式0, 1, 0, 0, -1, 0
  3. 还有什么建议吗?

这与这些问题有关,这些问题要么不回答我的问题,要么我不完全理解:

谢谢!

1个回答

要回答我自己的一些问题,经过额外的阅读和实验:

  1. 系数的诀窍在于它在Box-Cox 变换后的数据空间中。所以反转转换以获得原始单位的 beta。
  2. 是的,干预分析中的标准方法是对回归量使用阶梯函数,除非您有理由认为效果将是冲动或较慢的上升。

我发现有用的几个资源之一是McLeod 等人的 Time Series Analysis with Rforecast::forecast.Arima()我通过阅读代码弄清楚了 Box-Cox 的事情。