为什么自相关系数的不确定性随着滞后的增加而增加?

机器算法验证 时间序列 置信区间 自相关 统计模型 偏相关
2022-04-06 22:33:25

Python 模块statsmodels包含ACFPACF的函数。下面是文档中的一个示例,其中的图显示了自相关系数的(以零为中心的)置信区间。ACF 文档指出

返回 95 % 置信区间,其中标准偏差是根据 Bartlett 公式计算的。

我试图追查这个公式,发现一些幻灯片(第 6 页)似乎说明了估计自相关方法的方差1+ϕ21ϕ2随着滞后的增加,但我不明白其背后的原因。

是否有直观的解释来解释为什么 CI 在 ACF 图上随着滞后k的增加而变宽,但在 PACF 上却没有?

在我的新手理解中,k 处的 ACF 值等于您从第零项的单变量回归中获得的系数,作为第 k 项的函数。k 处的 PACF 值就像使用从 1 到 k 的所有项从多元回归中得到的第 k 个系数。那正确吗?

如果是这样,我不明白为什么 ACF 上的 CI 会变宽(除了 k 的每次增加都会使 n 减一)以及为什么这种效果对于 PACF 不一样。

(另一方面,看起来在R 实现中,ACF 的 CI 的宽度可能是恒定的——该图是否仅对所有 k 值使用 Bartlett 公式的限制?)

import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
dta = sm.datasets.sunspots.load_pandas().data
dta.index = pd.Index(sm.tsa.datetools.dates_from_range('1700', '2008'))
del dta["YEAR"]
sm.graphics.tsa.plot_acf(dta.values.squeeze(), lags=40)
sm.graphics.tsa.plot_pacf(dta.values.squeeze(), lags=40)
plt.show()

在此处输入图像描述

0个回答
没有发现任何回复~