为什么在计算自相关时减去平均值?

机器算法验证 时间序列 相关性 自相关
2022-03-28 02:37:51

自相关定义如下:

ρ^k=t=k+1T(rtr¯)(rtkr¯)(t=1Trtr¯)2

为什么需要从平均值中减去?

处的处的值还不够吗?k+1k

ρ=mean(rk+1rk)

2个回答

让我们从基础开始。方差告诉我们关于均值周围的可变性

Var(X)=E[(XE[X])2]

您可以将此概念推广到两个变量,即协方差

Cov(X,Y)=E[(XE[X])(YE[Y])]

其中方差是它的一个特例

Cov(X,X)=E[(XE[X])2]

相关性只是一个归一化的协方差,因此它的界限在 -1 和 1 之间,

Corr(X,Y)=Cov(X,Y)σXσY

自相关只是相关的一种特殊情况。

是的,您可以计算两个变量比率的期望值,在某些情况下,它可能是一个有意义的统计数据,但它不再衡量变量的“传播”或“共同传播”。

您可能有兴趣阅读如何向仅了解均值的人解释协方差?线。

与简单的协方差和相关性类似,在估计自相关(自协方差或互相关和互协方差)时减去均值。

以下是的协方差,其中从随机变量本身中减去随机变量的均值:XY

cov(X,Y)=E[(XE[X])(YE[Y])]

您的建议对应于之类的东西,它与协方差或相关性根本不同。E[X/Y]

在时间序列文献中,我们通常会看到类似于

xt=ρxt1+ϵt

但是,并非所有时间序列都是以这种方式生成的,因此忽略噪声项并进行粗略估计,如可能效果不佳,即使在这种类型的序列中,更不用说一般随机过程族。ρxt/xt1