我想基于具有多个外生变量的时间序列 ARIMA 模型进行预测。我的时间序列是几年中的月度失业数据(百分比),我的回归量是几篇维基百科文章的收视率维基百科流量数据的连续值。时间序列和回归量都具有相同的长度。
如何选择正确的回归器以包含在模型中?使用R 中“预测”包中的auto.arima和forecast函数,我的第一次尝试是在单独使用每个回归量时根据最佳结果 MAE 对回归量进行排序。所以,我首先只使用 1 个回归量(最好的 MAE),然后添加第二好的回归量,等等。不过,这篇文章建议根据重要性选择回归量,但Rob Hyndman 的这篇文章建议使用 AIC。
我应该如何进行?我如何接受/拒绝回归器?