自协方差、自相关和自相关系数

机器算法验证 时间序列 自习 自相关
2022-04-09 16:22:14

今年我正在学习关于时间序列的课程,这对我来说是一个全新的话题。我刚接到第一个任务,对一些术语感到困惑。

Q1。自协方差,自相关和自相关系数有什么区别?我试图用谷歌搜索它,但它们中的大多数对我来说真的没有意义。

Q2。问题要求估计 lag-1 自相关系数,但什么是滞后?它是一个变量吗?

任何帮助将非常感激!
我们不讲授本课程的幻灯片或任何其他材料,所以如果您有任何有用的教科书、论文或幻灯片,请随时在下面发表评论。

2个回答

Q1:假设您对变量有一段时间的观察{xt},t={1,...,T}. 如果它们是从二阶平稳随机过程 ( Click ) 生成的,您可以应用以下技术来找到第一个自协方差和第一个自相关系数。

计算观测值的协方差xt,t>1xt1,这给出了第一个自协方差。这概括了:Cov(xt,xtn)是第 n 个自协方差。如果将自协方差除以xt你得到自相关系数:ρ1=Cov(xt,xt1)Var(xt).

自相关是变量的属性xt由自相关系数表示,它告诉你实现了多少xt取决于最后的实现xt1. 这自然会导致自回归过程的想法。例如,1 阶自回归过程由下式给出xt=ρ1xt1+ϵt, 在哪里ϵt是标准正态随机变量。所以, xt1将有助于xt根据参数 ρ1. 点击

Q2:您可以将 Q1 的答案拼凑起来。滞后算子在变量上移动周期,例如xt到上一个时期。例如,L(xt)=xt1, 在哪里L()是一期滞后算子。你可以找到估计ρ1通过对一个时期前的变量的现值进行线性回归。

免责声明:鉴于最初的问题似乎相当初级,这意味着这是一个直观的解释,而不涉及数学细节。

要了解自协方差自相关之间的区别,有助于了解协方差相关之间的区别。

协方差是衡量两个成对变量 v1 和 v2 以相同方式/方向变化的程度。当 v1 高于其平均值同时 v2 高于其平均值和/或 v1 低于其平均值同时 v2 低于其平均值时为正。当相反的情况发生时,它是负数,即每当 v1 高于其平均值时,v2 低于其平均值,反之亦然。

重要的是要注意,协方差只能让您了解关系的方向,但很难解释关系的大小,因为它非常依赖于所使用的单位。(例如,如果您的变量以厘米为单位,然后将其转换为英寸,则协方差的绝对值将非常不同。

相关性通过缩放协方差并将其置于 -1 和 1 之间的区间来解决这个问题。相关性 1 表示您的两个变量完全正相关,-1 表示它们完全负相关(每当 v1 上升时,v2 下降) , 0 表示完全没有相关性。

现在,对于时间序列,“auto-”前缀表示您计算时间 t1 的一个变量与稍后时间 t1+k 的同一变量之间的协方差和相关性。例如,对于 k=1,您计算一次与下一次之间的协方差和相关性。k 表示时间点之间的差异或滞后,例如,如果您有月度数据,则 k=12 您将检查第一年和下一年的变量之间的关系。

然后,自相关系数为您提供每个滞后 k 的自相关。比较不同滞后的系数可以告诉您数据中是否存在季节性 - 例如,温度往往会随着季节而变化,因此您会期望月度数据在 k=12 左右具有更高的自相关系数。