与增强的 Dickey Fuller 测试混淆

机器算法验证 r 时间序列 平稳性
2022-02-04 17:04:02

我正在研究electricityR 包中可用的数据集TSA我的目标是找出一个arima模型是否适合这些数据并最终适合它。所以我按照以下步骤进行:

第一:绘制如果下图产生的时间序列:ts情节1

第二:我想记录日志electricity以稳定方差,然后适当地对序列进行差分,但就在这样做之前,我测试了平稳性使用(Augmented Dickey Fuller)测试的原始数据集adf,令人惊讶的是,结果如下:

代码和结果:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

好吧,根据我初学者的时间序列概念,我想这意味着数据是平稳的(p 值小,拒绝非平稳的零假设)。但是看着 ts 图,我发现这不可能是静止的。有人对此有有效的解释吗?

2个回答

由于您采用 k in 的默认值,adf.test在本例中为 7,因此您基本上是在测试过去 7 个月的信息集是否有助于解释xtxt1. 如您的图所示,用电量具有很强的季节性,并且可能在 7 个月之后具有周期性。如果设置 k=12 并重新测试,则不能拒绝单位根的空值,

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

假设“adf.test”确实来自“tseries”包(直接或间接),原因是它自动包含线性时间趋势。来自 tseries 文档(版本 0.10-35):“使用包含常数和线性趋势的一般回归方程 [...]”因此测试结果确实表明趋势平稳性(尽管名称不是平稳的)。

我也同意 Pantera 的观点,即季节性影响可能会扭曲结果。该序列实际上可能是时间趋势 + 确定性季节性 + 随机单位根过程,但 ADF 检验可能会将季节性波动误解为对确定性趋势的随机回归,这意味着根小于统一。(另一方面,鉴于您已经包含了足够的滞后,这应该显示为季节性频率的(虚假)单位根,而不是 ADF 测试所查看的零/长期频率。无论如何,鉴于季节性模式最好包括季节性。)