自相关和偏自相关的区别

机器算法验证 时间序列 相关性 偏相关
2022-03-13 14:00:08

我读过一些关于时间序列偏自相关的文章,我不得不承认,我并不真正理解与正常自相关的区别。人们常说,之间的偏自相关ytytk是之间的相关性ytytk之间的变量的影响ytytk删除?我不明白这个。如果我们计算之间的相关性ytytk那么无论如何,如果您使用相关系数来执行此操作,则根本不会考虑两者之间的变量。据我所知,相关系数仅考虑两个变量。

这真的让我很困惑。我希望你能帮助我。我会很感激每一条评论,并感谢您的帮助。

更新:任何人都可以尝试解释如何计算时间序列的自相关和偏自相关。我了解如何使用样本而不是时间序列来执行此操作(因为根据此处的示例https://en.wikipedia.org/wiki/Partial_correlation需要三个变量)。你知道这样做的任何例子吗?

2个回答

暂时忘记时间戳。考虑三个变量:X,Y,Z.

比方说Z对变量有直接影响X. 你可以想到Z作为美国的一些经济参数,它正在影响其他一些经济参数X中国的。

现在可能是一个参数Y(英格兰的一些参数)也直接受Z. 但两者之间存在独立的关系XY也是。这里的独立性是指这种关系独立于Z.

所以你看什么时候Z变化,X因为直接关系而改变XZ, 也因为Z变化Y这反过来又改变了X. 所以X因为两个原因而改变。

现在读这个Z=yth,  Y=yth+τX=yt(在哪里h>τ)。

之间的自相关XZ将考虑到所有变化X是否来自Z直接或通过Y.

偏自相关消除了间接影响ZX通过Y.

它是如何完成的?这在对您的问题的其他答案中进行了解释。

从线性回归的角度很容易看出(样本)ACF 和 PACF 之间的差异。

获取示例 ACFγ^h滞后h, 你拟合线性回归模型

yt=α+βyth+ut
以及由此产生的β^γ^h. 由于(弱)平稳性,估计β^是样本之间的相关性ytyth. (在时间序列和线性回归上下文之间如何计算样本矩之间存在一些细微的差异,但当样本量很大时它们可以忽略不计。)

获取示例 PACFρ^h滞后h, 你拟合线性回归模型

yt=α+?yt1++?yth+1+βyth+ut
以及由此产生的β^ρ^h. 所以ρ^h是“之间的相关性ytyth在控制了中间元素之后。”

相同的讨论逐字应用于总体 ACF 和 PACF 之间的差异。只需将样本回归替换为总体回归即可。对于静止的 AR(p) 过程,您会发现 PACF 对于滞后为零h>p. 这并不奇怪。该过程由线性回归指定。

yt=ϕ0+ϕ1yt1+ϕpytp+ϵt

如果你添加一个回归器(比如ytp1) 在与误差项不相关的右侧ϵt,得到的系数(滞后的 PACFp+1在这种情况下)将为零。