两个季节性序列之间的互相关

机器算法验证 时间序列 季节性 互相关
2022-03-30 22:32:22

Sales要确定和之间的互相关Variable cost,两者都具有月度季节性,我是否需要对这两个系列进行去季节性处理?

3个回答

基本问题是,您要解决什么问题?

如果您打算为数据建立一个好的模型(然后将模型用于假设检验、预测或其他),您需要考虑所有存在的模式。如果存在季节性,则应在模型中包含季节性模式。如果你不这样做,模型可能不够用;它可能会产生不可靠的假设检验结果、糟糕的预测等。

现在您说您想确定(我将其解释为估计)两个系列之间的互相关。我知道互相关只是针对两个系列的不同滞后与领先估计的常规相关性。对于直觉,考虑常规相关性就足够了,我将在以后这样做。这个想法可以从常规相关无缝地延续到互相关。

如果您的两个时间序列都是双变量,则样本相关性将对应于总体相关性。因此,您可以获得有意义的点估计、置信区间等等。但是,如果至少有一个时间序列不是,则定义样本相关性的总体对应物变得困难,并且随后的估计也难以解释。然后,为您的数据指定模型并开始根据模型提出问题变得更加容易。i.i.d.i.i.d.

现在假设这两个序列都是双变量同分布,除了它们的平均值中的季节性模式。然后您可以删除这些并估计季节性调整序列的相关性(此时应该大致是双变量)。但请注意,您在季节性调整后获得的相关性并不能说明您最初的问题,“这两个系列之间的相关性是什么?” 例如,您的两个系列可能具有完全相同的季节性模式,并且在其周围只有微小的随机变化。因此这两个系列几乎相同,您会直观地认为它们的相关性应该是正的并且非常高(接近统一)。但是你在季节性调整后得到的样本相关性i.i.d.i.i.d.可能在 [-1,1] 之间的任何地方,因为这两个系列的(估计的,但也是真实的)随机噪声分量可能相关,也可能不相关。因此,您将得到一个您并不真正感兴趣的问题的答案;无法保证答案会与您实际寻找的结果相近。

因此,我建议您依赖完全指定的模型(除非您的两个时间序列都是双变量)并根据模型提出问题。另一方面,如果您没有时间构建模型并且需要快速回答(这可能会发生),我相信两个系列之间相关性最相关的点估计将只是常规样本相关性(即使它的问题是在总体中没有有意义的对应物,并且其置信区间很难定义,如上所述)。i.i.d.

如果您要回归两个(不相关的)具有季节性的时间序列,您可能会得到所谓的虚假相关性此处提供了一个示例

“重要的是要考虑系列中是否存在显着趋势;如果我们忽略一个共同趋势,我们可能会估计一个虚假回归,其中变量似乎是相关的,因为对忽略的两者都有影响因素,时间的流逝”——来源yX

共同趋势可能是漂移或季节性模式。为了避免虚假相关,白化数据是基础,消除趋势和季节性的影响。然后,您可以对残差进行回归。

此处提供了对该问题的更正式介绍

“更正式的解决方案”的链接似乎转到了一个通用的 uni 页面。如果仍然可用,您能否更新它以指向该文章?