每个 ARIMA(1,1,0) 模型都等价于 AR(2) 模型吗?

机器算法验证 r 时间序列 有马
2022-04-03 04:05:23

假设我有一个时间序列我想使用以下形式的 ARIMA(1,1,0) 模型进行拟合:xt

Δxt=αΔxt1+wt

这可以重写为:

xtxt1=α(xt1xt2)+wt

xt=(1+α)xt1αxt2+wt

最后一个方程描述了一个 AR(2) 模型,其系数为我认识到,根据,这个 AR(2) 模型可能是非平稳的。但是,如果我一开始就采用差异,那么我正在建模的系列不应该是静止的。1+ααα

我知道如果模型是非平稳的,应该使用差异。但是,如果我使用 AR(2) 模型与 ARIMA(1,1,0) 模型,结果会有什么不同呢?我假设(如 R 所暗示的那样)它存在收敛问题。但是,当我要求 R 执行拟合时,它会同时执行它们,并且系数(大部分)与我上面的观察结果一致。不过,预测肯定是不同的。

如果有人可以对此有所了解,或者为我指出一个好的参考,我将不胜感激。

这是我用来生成这两个模型的 R 代码。

> set.seed(2)
> x <- arima.sim(n = 1000, model=list(order=c(1,1,0), ar=c(0.3)))
> plot(x)
> arima(x, order=c(1,1,0))

Call:
arima(x = x, order = c(1, 1, 0))

Coefficients:
         ar1
      0.3291
s.e.  0.0298

sigma^2 estimated as 1.03:  log likelihood = -1433.91,  aic = 2871.81
> arima(x, order=c(2,0,0))

Call:
arima(x = x, order = c(2, 0, 0))

Coefficients:
         ar1      ar2  intercept
      1.3290  -0.3294    50.9803
s.e.  0.0298   0.0299    35.9741

sigma^2 estimated as 1.03:  log likelihood = -1438.93,  aic = 2885.86
Warning messages:
1: In log(s2) : NaNs produced
2: In log(s2) : NaNs produced
3: In log(s2) : NaNs produced
4: In arima(x, order = c(2, 0, 0)) :
  possible convergence problem: optim gave code = 1
2个回答

ARIMA(1,1,0) 的预测强制执行的限制。d=1

在 AR(1) 与 ARIMA(0,1,0) 的情况下可能更容易看出:后者只是 ,其最优预测在所有范围内都是 0(我们预计取值为零)。如果我们的目标是预测本身,我们取最后一个样本值,并只累积的预测变化。基本上,我们预计明天的价值是今天的价值加上从今天到明天的预期变化。

Δyt=ϵt
ϵtytyt

因此,由于我们预计此处不会有任何变化,因此是样本观察中的最后一个)yTTh=T+1,

另一方面,如果我们拟合一个 AR(1) 模型,我们会得到一个估计值,并从一个 AR(1) 模型中生成最优预测,即 如果估计误差(在有限样本中通常会如此)使得与真实值 1 不同,则预测将不同。α^

yT+h=α^hyT
α^

等价性取决于定义。一般 ARMA(p,q) 过程可以定义为一个随机过程,它是以下方程的解:

Xtϕ1Xt1...ϕpXtp=Zt+θ1Zt1+...+θqZtq,

其中是白噪声过程。我们必须要求多项式不应该有共同根,在方程的顺序是唯一定义的。Ztϕ(z)=1ϕ1z...ϕpzpθ(z)=1+θ1z+...θpzp

现在问题出现了,当这个方程有解时。答案取决于多项式的性质。当多项式在单位圆上没有根时,方程有一个固定解。ϕ(z)θ(z)

所以从这个意义上说,ARIMA(1,1,0) 不是 AR(2) 过程,因为它不是静止的。它可以写成满足 AR(2) 方程,但由于多项式在单位圆上有根,所以无法求解方程。然而,如果多项式具有单位根,则满足 ARMA(p-1,q) 方程(具有不同的多项式)。因此可以求解并返回为了标记这种差异,使用了 ARIMA(p,d,q) 表示法。ϕ(z)ΔXtΔXtXt

综上所述,如果我们将 ARMA(p,q) 过程严格定义为 ARMA(p,q) 方程的平稳解,那么 ARIMA(1,1,0) 和 AR(2) 是不等价的。

R 设法找到正确系数的事实是估计的一个有趣特性,即有可能表明在单位根的情况下,OLS[1] 将给出一致的系数估计,但推断将是不正确的,因为极限分布不正常。ADF 测试基于这样的估计。然而,实际数学表明估计是好的是相当复杂的,并且依赖于某些假设。这些假设不能很好地概括,因此不建议对单位根过程使用通常的估计方法。

[1] MLE 和 OLS 等效于 AR(p) 类型规范。