Box-Jenkins 模型选择

机器算法验证 回归 时间序列 有马 模型选择 盒子詹金斯
2022-03-08 21:45:49

时间序列分析中的 Box-Jenkins 模型选择过程从查看序列的自相关和偏自相关函数开始。这些图可以建议ARMA模型该过程继续要求用户应用 AIC/BIC 标准,以在产生具有白噪声误差项的模型的模型中选择最简约的模型。pq(p,q)

我想知道这些视觉检查和基于标准的模型选择步骤如何影响最终模型的估计标准误差。例如,我知道横截面域中的许多搜索过程可能会使标准误差向下偏斜。

第一步,通过查看数据 (ACF/PACF) 选择适当的滞后数如何影响时间序列模型的标准误差?

我猜想根据 AIC/BIC 分数选择模型会产生类似于横截面方法的影响。我实际上对这个领域也不太了解,所以在这一点上任何评论都将不胜感激。

最后,如果你写下每个步骤使用的精确标准,你能否引导整个过程来估计标准误差并消除这些问题?

2个回答

在我看来,选择适当的滞后数与在逐步前向回归过程中选择输入序列的数量没有什么不同。滞后或特定输入序列的增量重要性是暂定模型规范的基础。

既然你已经断言 acf/pacf 是 Box-Jenkins 模型选择的唯一依据,那么让我告诉你一些经验教会了我什么。如果一个系列显示出不衰减的 acf,Box-Jenkins 方法(大约 1965 年)建议对数据进行差分。但是,如果一个序列有水平偏移,比如尼罗河数据,那么“视觉上明显的”非平稳性是所需结构的症状,但差分不是补救措施。这个 Nile 数据集可以通过简单地首先确定对电平转换的需要进行建模而无需差分。以类似的方式,我们使用 1960 年的概念来教导我们,如果 acf 表现出季节性结构(s,2s,3s,...) 时的显着值,那么我们应该加入一个季节性 ARIMA 组件。出于讨论的目的,考虑一个围绕平均值并以固定间隔固定的序列,例如每年六月都有一个“高值”。通过合并 0 和 1 的“老式”虚拟系列(在 6 月)对这个系列进行了适当的处理,以处理季节性结构。季节性 ARIMA 模型会错误地使用内存而不是未指定但等待找到的 X 变量。这两个识别/合并未指定确定性结构的概念是 I. Chang、William Bell、George Tiao、R.Tsay、Chen等人(从 1978 年开始)在干预检测的一般概念下的工作的直接应用。

即使在今天,一些分析师仍在盲目地执行内存最大化策略,称它们为自动 ARIMA,而没有认识到“无意识的内存建模”假设脉冲、电平转换、季节性脉冲和本地时间趋势等确定性结构不存在,或者更糟的是,它们没有发挥作用在模型识别中的作用。恕我直言,这类似于将头埋在沙子里。

任何模型选择程序都会影响标准误差,而这几乎没有考虑到。例如,预测区间是根据估计的模型有条件地计算的,而参数估计和模型选择通常被忽略。

应该可以引导整个过程以估计模型选择过程的效果。但请记住,时间序列引导比正常引导更棘手,因为您必须保持序列相关性。块引导是一种可能的方法,尽管它由于块结构而失去了一些串行相关性。