多元线性回归与时间序列

机器算法验证 回归 时间序列 预测 预测模型
2022-04-09 15:24:18

我有每周 3 年的销售数据。我需要每周预测下一年的销售额。

企业要求将一些分类值和数值(例如类别、提供的产品数量和每周流量)作为系数包括在内,它们可以在明年改变,因此预测也会改变。使用多线性回归模型,这将非常容易。(我计划在 2 年训练模型并在 3 日进行测试)

由于我的数据肯定是季节性的,我认为我需要使用时间序列模型。(我在想 ARIMA,但欢迎任何其他建议)。但是,在过去使用 ARIMA 时,我只是有一个时间戳并预测未来时间戳的值,而没有其他可以由用户更改的系数。

这可能是我对时间序列模型的误解,但是是否存在可以像多线性回归模型一样具有可调整系数的模型的组合,但确实考虑了季节性?

或者外推是要走的路?

我看了这两个问题,但它们并没有直接帮助我。

线性回归与时间序列分析

时间序列预测与线性回归外推

2个回答

最流行的时间序列预测方法是 ARIMA 和 Holt-Winters。Holt-Winters 更简单,计算成本更低。它专为季节性设计。如果您使用 ARIMA,则必须使用季节性 ARIMA。一些研究表明,在现实生活数据中,Holt-Winters 和季节性 ARIMA 不仅具有相似的准确性,而且预测的值也相似(http://webarchive.nationalarchives.gov.uk/20160105160709/http://www.ons.gov .uk/ons/guide-method/ukcemga/ukcemga-publications/publications/archive/from-holt-winters-to-arima-modelling--measuring-the-impact-on-forecasting-errors-for-components-of-季度估计公共服务输出.pdf)。

您的问题是多变量时间序列,不仅仅是而是y(t)y(X,t)

一个想法是尝试诸如具有时变系数的线性回归之类的东西。考虑一个没有时间的线性模型:其中是一个向量。然后引入时间:然后将视为向量时间序列。y(X)=βXβy(X,t)=β(t)Xβ(t)

但是你不能观察到β(t)

我还没有读过任何解决这个问题的文章,尽管它在某种程度上是一个越来越重要的问题:一起研究时间和其他参数。

如果每次都有很多 (y,X) 样本很好地覆盖了 X 的可能值,那么您可能每次都但我猜你的数据不是这样的。β(t)

添加:

可以真正将作为隐藏参数的最终解决方案是卡尔曼滤波器如果只是一个随机游走,那么卡尔曼滤波器的状态就是,这并不难实现,使用观察来更新滤波器。下一步是在过滤器中使用 ARIMA 或 HW 模型,但这开始是硬核数学。我不知道这样的东西被打包成一个易于使用的工具。您可以阅读更多相关信息:状态空间模型和卡尔曼滤波器用于时间序列建模的缺点是什么?β(t)β(t)β(t)