我有两个与 ARIMA 时间序列预测相关的问题:
- ARIMA 是否需要正态分布的错误或正态分布的输入数据?
- 对 ARIMA 模型的输入时间序列数据和 ARIMAX 模型的外生变量是否有任何假设?
我有两个与 ARIMA 时间序列预测相关的问题:
首先,具有正态分布的误差等同于具有任何线性时间序列模型的正态分布观测值。
其次,没有必要假设错误的正态性。通常,使用最大似然来估计模型的参数,然后使用高斯似然,但即使使用非正态数据也能得到很好的结果。通常假设误差的正态性是在使用 AIC 进行订单选择和计算预测区间时。
具有外生变量的 ARIMA 模型有多种规格,并且不止一种这样的规格被称为 ARIMAX 模型,因此如果不更准确地指定模型,就不可能准确回答您的第二个问题。有关某些模型的讨论,请参阅http://robjhyndman.com/hyndsight/arimax/
否 -非高斯 ARMA 模型的最大似然估计论文研究了具有 Student-t 和拉普拉斯分布误差的 ARMA 模型。这是摘要:
“我们考虑一种近似最大似然算法,用于估计由独立同分布非高斯噪声驱动的可能非因果和不可逆自回归移动平均过程的参数。归一化近似最大似然估计具有一致且有效的全局最大值. 使用 FORTRAN 77 中实现的子程序计算估计值及其相关的渐近协方差矩阵。
要回答您的第一个问题并引用[1],
数学告诉我们,只有当过程是高斯过程时,线性预测器才能是最优的。当过程为非高斯过程时,非线性动态模型可能会给出更好的预测器(Masani 和 Wiener,1959)。
为什么统计学家,无论老少,都对它保持沉默,我不知道。
参考:
[1] Ozaki, T. & Iino, M. An Innovation approach to non-Gaussian time series analysis Journal of Applied Probability, 2001, 38, 78-92