机器算法验证 - Box-Jenkins 方法回顾 - 吾爱随笔录

我刚刚用python（主要是statsmodels）开发了一个ARMAX模型来预测一些数据。我的下一步是使用给定的 ARMAX 模型测试数据（24 个时间序列）。由于我需要为我使用的所有测试以及我测试数据的方式编写适当的学术文档，因此我需要有一个适当的测试设计。

但是，我的模型和测试设计如下所示：

数据准备（识别和差异数据以获得平稳序列）
- 每小时的描述性统计数据（计数、平均值、偏度等）
- 增强的 Dickey Fuller 检验以检测给定时间序列的平稳性

--> excel-documentation：时间序列的平稳性存在！

模型选择（检查数据、ACF、PACF 以识别潜力（选择暂定的 p 和 q）
- 绘制和分析 ACF 和 PACF
- 自动选择最低信息标准（AIC、BIC、HQIC）

--> excel-documentation：ACF和PACF图/图片，图解释，最低信息标准（AIC，BIC，HQIC）

--> excel-documentation：哪些参数将用于 arma.prediction

--> excel-documentation：Durbin-Watson-Test-Results、Normality-Test-Results、Ljung-Box-Test 总结（Q>0，y/n？）

--> excel-documentation：给定 p 和 q 值的预测值（参见“3. 估计”）

--> excel-documentation：给定 p 和 q 值的 MAPE

回到'3。估计”，如果诊断结果和 MAPE 不令人满意，则再次运行
基于信息标准最优选择的最大重新运行时间：如果模型输出不令人满意，则选择更高和更低的 p 值和 q 值。使用最低 BIC 和/或 HQIC（如果 AIC、BIC 和 HQIC 建议相同的 p 和 q 值，使用不同的方法）

如果有人能花一点时间告诉我从学术角度来看这听起来是否合理，那就太好了。

坦克提前