机器算法验证 - 每个 ARIMA(1,1,0) 模型都等价于 AR(2) 模型吗？ - 吾爱随笔录

每个 ARIMA(1,1,0) 模型都等价于 AR(2) 模型吗？

机器算法验证 r 时间序列有马

2022-04-03 04:05:23

假设我有一个时间序列我想使用以下形式的 ARIMA(1,1,0) 模型进行拟合： $x_t$

$\Delta x_t = \alpha \Delta x_{t-1} + w_t$

这可以重写为：

$x_t - x_{t-1} = \alpha ( x_{t-1} - x_{t-2} )+ w_t$

$x_t = ( 1 + \alpha)x_{t-1} - \alpha x_{t-2} + w_t$

最后一个方程描述了一个 AR(2) 模型，其系数为和。我认识到，根据，这个 AR(2) 模型可能是非平稳的。但是，如果我一开始就采用差异，那么我正在建模的系列不应该是静止的。 $1+\alpha$ $-\alpha$ $\alpha$

我知道如果模型是非平稳的，应该使用差异。但是，如果我使用 AR(2) 模型与 ARIMA(1,1,0) 模型，结果会有什么不同呢？我假设（如 R 所暗示的那样）它存在收敛问题。但是，当我要求 R 执行拟合时，它会同时执行它们，并且系数（大部分）与我上面的观察结果一致。不过，预测肯定是不同的。

如果有人可以对此有所了解，或者为我指出一个好的参考，我将不胜感激。

这是我用来生成这两个模型的 R 代码。

> set.seed(2)
> x <- arima.sim(n = 1000, model=list(order=c(1,1,0), ar=c(0.3)))
> plot(x)
> arima(x, order=c(1,1,0))

Call:
arima(x = x, order = c(1, 1, 0))

Coefficients:
         ar1
      0.3291
s.e.  0.0298

sigma^2 estimated as 1.03:  log likelihood = -1433.91,  aic = 2871.81
> arima(x, order=c(2,0,0))

Call:
arima(x = x, order = c(2, 0, 0))

Coefficients:
         ar1      ar2  intercept
      1.3290  -0.3294    50.9803
s.e.  0.0298   0.0299    35.9741

sigma^2 estimated as 1.03:  log likelihood = -1438.93,  aic = 2885.86
Warning messages:
1: In log(s2) : NaNs produced
2: In log(s2) : NaNs produced
3: In log(s2) : NaNs produced
4: In arima(x, order = c(2, 0, 0)) :
  possible convergence problem: optim gave code = 1

2个回答

ARIMA(1,1,0) 的预测强制执行的限制。 $d=1$

在 AR(1) 与 ARIMA(0,1,0) 的情况下可能更容易看出：后者只是，其最优预测在所有范围内都是 0（我们预计取值为零）。如果我们的目标是预测本身，我们取最后一个样本值，并只累积的预测变化。基本上，我们预计明天的价值是今天的价值加上从今天到明天的预期变化。

Δ y_{t} = ϵ_{t}

$\Delta y_t=\epsilon_t$

ϵ_{t}

$\epsilon_t$

y_{t}

$y_t$

y_{t}

$y_t$

因此，由于我们预计此处不会有任何变化，因此（是样本观察中的最后一个）。 $y_T$ $T$ $h=T+1,\ldots$

另一方面，如果我们拟合一个 AR(1) 模型，我们会得到一个估计值，并从一个 AR(1) 模型中生成最优预测，即如果估计误差（在有限样本中通常会如此）使得与真实值 1 不同，则预测将不同。 $\hat\alpha$

y_{T + h} = {\hat{α}}^{h} y_{T}

$y_{T+h}=\hat\alpha^hy_T$

\hat{α}

$\hat\alpha$

等价性取决于定义。一般 ARMA(p,q) 过程可以定义为一个随机过程，它是以下方程的解：

X_{t} - ϕ_{1} X_{t - 1} - . . . - ϕ_{p} X_{t - p} = Z_{t} + θ_{1} Z_{t - 1} + . . . + θ_{q} Z_{t - q},

$X_t-\phi_1X_{t-1}-...-\phi_pX_{t-p}=Z_t+\theta_1 Z_{t-1}+...+\theta_qZ_{t-q},$

其中是白噪声过程。我们必须要求多项式和不应该有共同根，在方程的顺序是唯一定义的。 $Z_t$ $\phi(z)=1-\phi_1 z-...-\phi_pz^p$ $\theta(z)= 1+\theta_1z+...\theta_pz^p$

现在问题出现了，当这个方程有解时。答案取决于多项式和的性质。当多项式在单位圆上没有根时，方程有一个固定解。 $\phi(z)$ $\theta(z)$

所以从这个意义上说，ARIMA(1,1,0) 不是 AR(2) 过程，因为它不是静止的。它可以写成满足 AR(2) 方程，但由于多项式在单位圆上有根，所以无法求解方程。然而，如果多项式具有单位根，则满足 ARMA(p-1,q) 方程（具有不同的多项式）。因此可以求解并返回。为了标记这种差异，使用了 ARIMA(p,d,q) 表示法。 $\phi(z)$ $\Delta X_t$ $\Delta X_t$ $X_t$

综上所述，如果我们将 ARMA(p,q) 过程严格定义为 ARMA(p,q) 方程的平稳解，那么 ARIMA(1,1,0) 和 AR(2) 是不等价的。

R 设法找到正确系数的事实是估计的一个有趣特性，即有可能表明在单位根的情况下，OLS[1] 将给出一致的系数估计，但推断将是不正确的，因为极限分布不正常。ADF 测试基于这样的估计。然而，实际数学表明估计是好的是相当复杂的，并且依赖于某些假设。这些假设不能很好地概括，因此不建议对单位根过程使用通常的估计方法。

[1] MLE 和 OLS 等效于 AR(p) 类型规范。

其它你可能感兴趣的问题

上一篇机器学习中的傅里叶变换下一篇确定性聚类方法