在什么情况下适合 MA 流程或 AR 流程?

机器算法验证 时间序列 自回归的 移动平均线
2022-02-08 12:36:26

我知道如果一个过程依赖于它自己以前的值,那么它就是一个 AR 过程。如果它依赖于以前的错误,那么它是一个 MA 过程。

这两种情况中的任何一种何时会发生?有没有人有一个可靠的例子来阐明关于将流程最好地建模为 MA 与 AR 意味着什么的潜在问题?

3个回答

一个重要且有用的结果是Wold 表示定理(有时称为 Wold 分解),它表示每个协方差平稳时间序列Yt可以写成两个时间序列的总和,一个是确定性的,一个是随机的。

Yt=μt+j=0bjεtj, 在哪里μt是确定性的。

第二项是无限 MA。

(可逆的 MA 也可以写成无限的 AR 过程。)

这表明如果序列是协方差平稳的,并且如果我们假设您可以识别确定性部分,那么您始终可以将随机部分写为 MA 过程。同样,如果 MA 满足可逆性条件,您始终可以将其编写为 AR 过程。

如果您以一种形式编写流程,则通常可以将其转换为另一种形式。

因此,至少在某种意义上,对于协方差平稳序列,通常 AR 或 MA 都是合适的。

当然,在实践中,我们宁愿没有非常大的模型。如果你有一个有限的 AR 或 MA,ACF 和 PACF 最终都会以几何方式衰减(有一个几何函数,任一函数的绝对值都将位于下方),这往往意味着 AR 或另一种形式的 MA 通常可能相当短。

因此,在协方差平稳条件下并假设我们可以识别确定性和随机分量,通常 AR 和 MA 可能都是合适的。

Box 和 Jenkins 方法寻找一个简约的模型——一个参数很少的 AR、MA 或 ARMA 模型。通常,ACF 和 PACF 用于尝试识别模型,通过转换为平稳性(可能通过差分),从 ACF 和 PACF 的外观识别模型(有时人们使用其他工具),拟合模型,然后检查残差的结构(通常通过残差上的 ACF 和 PACF),直到残差序列与白噪声合理一致。通常会有多个模型可以为系列提供合理的近似值。(在实践中,通常会考虑其他标准。)

有一些理由批评这种方法。例如,这种迭代过程产生的 p 值通常不考虑模型的到达方式(通过查看数据);例如,通过样本拆分至少可以部分避免这个问题。第二个批评的例子是实际获得平稳序列的困难 - 虽然在许多情况下可以转换以获得看起来与平稳性相当一致的序列,但通常情况并非如此(类似的问题是常见的统计模型的问题,尽管有时它可能在这里更成问题)。

[Hyndman 和 Athanasopoulos 的预测:原理和实践中讨论了 AR 和相应的无限 MA 之间的关系这里]

我可以对问题的第一部分(“从哪里 MA?”)提供我认为令人信服的答案,但目前正在考虑对问题的第二部分(“从哪里 AR?”)提供同样令人信服的答案。

考虑一个由连续几天的股票收盘价(根据拆分和股息调整)组成的序列。每天的收盘价来自趋势(例如,时间线性)加上前几天每日冲击的加权效应。据推测,t-1 日的冲击对 t 日价格的影响比 t-2 日的冲击更大,依此类推。因此,从逻辑上讲,股票在 t 日的收盘价将反映趋势t 天的值加上一个常数(小于 1)乘以 t-1 天的冲击加权总和(即 t-1 天的误差项)(MA1),可能加上一个常数(小于 1)乘以 t-2 天的冲击加权总和(即 t-2 天的误差项)(MA2),...,加上 t 天的新冲击(白噪声)。这种模型似乎适用于像股票市场这样的建模系列,其中第 t 天的误差项代表先前和当前冲击的加权和,并定义了 MA 过程。我正在研究一个同样令人信服的理由来建立一个专门的 AR 流程。

所以你有一个单变量时间序列,你想对其建模/预测,对吧?您已选择使用 ARIMA 类型模型。

的参数取决于最适合您的数据集的参数。但是你怎么知道呢?最近的一种方法是 Hyndman & Khandakar (2008) ( pdf ) 的“自动时间序列预测”。

该算法尝试不同版本的 p、q、P 和 Q,并选择具有最小 AIC、AICc 或 BIC 的版本。它在预测 R 包的 auto.arima() 函数中实现。信息标准的选择取决于您传递给函数的参数。

对于线性模型,选择具有最小 AIC 的模型可以等效于留一法交叉验证。

你还应该确保你有足够的数据,至少四年。

一些重要的检查:

  1. 模型有意义吗?例如,如果您有每月的零售额,您可能会期望适合的季节性模型。
  2. 它在样本外的预测效果如何?

明确回答下面 Firebug 的评论:当您的数据支持它时。