时间序列数据中的自相关和异方差

机器算法验证 回归 时间序列 自相关 异方差
2022-04-15 10:54:47

在一年的时间里,我有几个两个变量的时间序列(大约 2.5k 次观察)。我假设一个变量 ( x ) 作为另一个变量 ( y ) 的潜在预测因子。我寻找了y最好由x描述的时期(“最好”,如最强的 Pearson ),从那个最佳时期进行观察,计算简单的线性回归模型及其参数,并在所有x上预测y因此,我在一年的同一时间序列中有两个y - 观察和预测,后者是从最佳时期计算的回归模型的结果。

现在,我在最佳时期的数据中检测到自相关和异方差。对于一个示例时间序列,请参见下面的回归诊断图和其中的统计测试结果。

在此处输入图像描述

左上图:散点图中的原始数据;右上图:残差与独立变量(DW = Durbin Watson 检验和 BG = Breusch-Godfrey 自相关检验);左中:残差与拟合图(BP = Breusch-Pagan 异方差检验);右中:正态 QQ 图(W = Shapiro-Wilk 检验,A = Anderson-Darling 残差正态性检验);左下:比例位置图,右下:残差与杠杆图检测异常值。

从测试和目视检查中,我可以推断出我的数据中存在自相关和异方差。我有点坚持如何从这里开始。特别是,我会很高兴在以下方面提供帮助:

  1. 自相关在时间序列数据中很常见,这并不意味着我不必对其进行校正,我猜?
  2. 残差的正态性并不重要,尤其是对于较大的样本量。我的最佳时期的样本量至少有 240 个观察值。足以解决这个问题?
  3. 对于纯粹的预测目的,这是我主要感兴趣的,我听说回归诊断及其处理对预测值没有太大的改进,但对t - 和F - 统计量很重要。如果它是我所追求的预测,我是否应该担心纠正诊断所揭示的任何问题
  4. Box-Cox 变换可以帮助纠正异方差,而 Cochrane-Orcutt、Hildreth-Lu 或 First Differences Procedures 可以解决自相关问题,至少在理论上是这样。我怎么知道首先要解决哪个问题?纠正异方差是改善还是恶化自相关情况,反之亦然是否有一种程序可以一次性缓解这两个问题(即 Newey-West 估计器)?

散点图表明线性回归模型不能很好地描述这种关系,并且可能首先更适合 gls 模型。但是,我想始终将线性模型应用于我的所有时间序列,即使它们可能不能很好地解释数据的分布。这本身就是一个有趣的结果。

我正在使用 R 环境进行分析。

1个回答

当存在未经处理的确定性效应时,我们已经看到了像你这样的残差图。这些可能包括每小时或每天的效果。应注意识别和合并任何所需的影响,如脉冲、电平转换、季节性脉冲和/或本地时间趋势。还应包括模型诊断建议的所需 ARIMA 结构。此时考虑测试参数随时间的恒定性,因为参数可能已更改或测试误差方差随时间的恒定性。随时间变化的非恒定误差方差可以通过 TSAY 测试来纠正,如此处所述http://docplayer.net/12080848-Outliers-level-shifts-and-variance-changes-in-time-series.html或经典 Box -考克斯测试。TSAY 测试应首先实施,因为它是侵入性最小的转换。

使用预先白化的互相关与上述相结合的正确传递函数识别过程应该会产生一个有用的模型。我在这里描述的过程基本上是我加入到 AUTOBOX 中的,这是我帮助开发的一个软件。您可以尝试自己对此进行编程,但这可能会很耗时。

OP评论后编辑

来自暂定模型的残差 ACF 表明需要使用 arima 结构来增强当前模型。来自暂定模型和预白化 X 变量的残差 ccf 表明 TF 结构可能会有所改进。是的,您可以使用 CCF https://onlinecourses.science.psu.edu/stat510/node/75 “查看初始滞后” 为什么预美白很重要?. 这实际上是一个可能的方法的雷区,这就是我自动化该过程的原因。自动化并不能保证最优性,但它确实扫清了道路。应谨慎避免该领域的非时间序列专家的建议,因为您的问题可能令人生畏。

http://autobox.com/cms/images/dllupdate/TFFLOW.png是一个开始......在预测检查之前添加 1)参数的恒定性和 2)误差过程的方差的恒定性。现在您有了工作说明(流程图),下一部分是手动或使用创造性的生产力辅助工具来实现它。

这是(有点)重复但....

1.平稳性条件,即 X 和 Y 的差异顺序 2.X 分量在所需滞后方面的形式,即分子和分母结构 3.所需的武器 4.干预检测变量的需要,即。脉冲、电平转换、季节性脉冲、本地时间趋势 5.需要处理明显的参数随时间变化 6.需要处理明显的确定性方差变化需要加权最小二乘 7.需要处理明显的方差变化需要电源转换的级别依赖