使用带有外部回归器的 ARIMA 预测每日访问量

机器算法验证 r 预测 有马
2022-04-05 00:54:49

我有过去 10 年的每日访问者数据。我想做一些基本的测试,比如哪一天最忙、哪一个月最忙、哪一周最忙等。我使用auto.arima带参数的函数xreg来找出一周中的所有天、一个月中的一周的系数。这是我得到的输出:

> summary(arima1)
Series: dailysea 
ARIMA(1,1,2)                    

Coefficients:
          ar1      ma1      ma2         Sun        Mon         Tue        Wed         Thu
      -0.1250  -0.4506  -0.3712  -1466.6853  -3623.175  -3895.0555  -3722.146  -3327.4288
s.e.   0.1207   0.1117   0.0891    325.7253    386.738    379.8793    379.883    386.7512
            Fri
      -2146.910
s.e.    325.736

sigma^2 estimated as 7776468:  log likelihood=-6808.5
AIC=13637   AICc=13637.31   BIC=13682.92

Training set error measures:
                   ME     RMSE      MAE  MPE MAPE      MASE         ACF1
Training set 59.63838 2784.809 1952.625 -Inf  Inf 0.8353728 -0.001839015

我可以使用这些系数得出结论,周六是最繁忙的,其次是周日、周五等?我也有无限的 MAPE,这对我来说没有意义。

1个回答

一个没有检验/p 值但粗略估计置信区间的答案:在系数上添加两倍的 se(标准误差)应该会给每个系数大约 95% 的置信区间。从这个角度来看,周日的 95% 置信区间大致在 -1800 和 -1100 之间,这与周六假设的零影响相去甚远。扩展您所看到的论点,那个星期日与其他所有日子相距甚远,而星期一、星期二、星期三、星期四则非常接近。