时间序列和回归之间的关系和区别?

机器算法验证 回归 时间序列 盒子詹金斯
2022-03-16 22:30:13

时间序列和回归之间有什么关系和区别?

对于模型和假设,回归模型假设输入变量的不同值的输出变量之间的独立性是否正确,而时间序列模型则不然?还有哪些不同之处?

对于方法,来自Darlington 的网站

时间序列分析有多种方法,但最著名的两种方法是回归方法和 Box-Jenkins (1976) 或 ARIMA(自回归综合移动平均)方法。本文档介绍回归方法。我认为回归方法远远优于 ARIMA,主要有以下三个原因

我不太明白网站上时间序列的“回归方法”是什么,以及它与 Box-Jenkins 或 ARIMA 方法有何不同。如果有人可以就这些问题提供一些见解,我将不胜感激。

谢谢并恭祝安康!

2个回答

我真的认为这是一个很好的问题,值得回答。提供的链接是由一位心理学家编写的,他声称某些自制方法是比 Box-Jenkins 更好的时间序列分析方法。我希望我对答案的尝试将鼓励其他对时间序列更了解的人做出贡献。

从他的介绍来看,Darlington 似乎支持通过最小二乘法拟合 AR 模型的方法。也就是说,如果你想拟合模型

zt=α1zt1++αkztk+εt
到时间序列zt, 你可以只回归系列zt在有滞后的系列上1, 滞后2, 依此类推直到滞后k,使用普通的多元回归。这当然是允许的;在 R 中,它甚至是ar函数中的一个选项。我对其进行了测试,它往往会给出与在 R 中拟合 AR 模型的默认方法类似的答案。

他还主张倒退zt在诸如此类的事情上t或权力t寻找趋势。同样,这绝对没问题。许多时间序列书籍都讨论了这一点,例如 Shumway-Stoffer 和 Cowpertwait-Metcalfe。通常,时间序列分析可能会按照以下方式进行:您找到趋势,将其移除,然后将模型拟合到残差。

但似乎他也在提倡过拟合,然后用拟合序列和数据之间均方误差的减少来证明他的方法更好。例如:

我觉得相关图现在已经过时了。他们的主要目的是让工作人员猜测哪些模型最适合数据,但是现代计算机的速度(至少在回归中,如果不是在时间序列模型拟合中)允许工作人员简单地拟合几个模型并确切地了解如何每一个都符合均方误差。[机会资本化问题与这个选择无关,因为这两种方法同样容易受到这个问题的影响。]

这不是一个好主意,因为模型的测试应该是它可以预测的程度,而不是它与现有数据的拟合程度。在他的三个示例中,他使用“调整后的均方根误差”作为拟合质量的标准。当然,过度拟合模型会使样本内误差估计值更小,因此他声称他的模型“更好”是因为它们具有更小的 RMSE 是错误的。

简而言之,由于他使用了错误的标准来评估模型的好坏,因此他得出​​了关于回归与 ARIMA 的错误结论。我敢打赌,如果他改为测试模型的预测能力,ARIMA 会名列前茅。如果有人可以访问他在这里提到的书籍,也许有人可以尝试一下。

[补充:有关回归概念的更多信息,您可能想查看在 ARIMA 成为最流行之前编写的较早的时间序列书籍。例如,Kendall,时间序列,1973,第 11 章有一整章介绍了这种方法并与 ARIMA 进行了比较。]

E. Parzen 教授可能有些羡慕他没有提出 Box 和 Jenkins 的创新方法,提出了这种过拟合然后下台的方法。它失败的原因有很多(其中有很多比 Flounderer 已经很好地总结了),包括没有识别和纠正脉冲、电平转换、季节性脉冲和本地时间趋势。此外,需要考虑参数随时间的变化或误差方差随时间的变化。

我写了一篇你可能感兴趣的文章。它叫做“Regression vs Box-Jenkins”,可从http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting /doc_download/24-regression-vs-box-jenkins

关于反映时间、时间*时间、时间*时间*时间*时间作为预测变量的达林顿程序的一条评论。在没有导致孤立异常效应的干预检测的情况下,很有可能(而且不正确!)得出更高时间的结论。当心非统计学家进行统计分析,因为你会警惕统计学家进行脑部手术。公平地说,人们可能还会提防非时间序列统计学家/数学家试图在时间序列分析方面受过有限培训的情况下进行时间序列分析。

此列表中的其他海报(尤其是 whuber)一再警告不要使用这种“拟合方法”,主要是在单变量环境中。此警告也适用于因果模型。

希望这可以帮助。