使用单个模型预测多个时间序列

数据挖掘 机器学习 时间序列 预测
2022-02-16 20:47:40

我有一个数据集,其中包含约 500 个不同市场(假设不同的城市或地区)的销售数字,并且需要每个市场的月度预测。我感兴趣的不是构建 500 个不同的模型,而是只使用一组参数训练一个模型,以防止我不得不手动对每个市场进行特征工程。

有人可以为我指出这个问题的一些资源吗?我经历了类似的堆栈问题,但它们对此并没有特别的帮助。

具体来说,我知道这里有时会使用 LSTM,但经典方法也会有效吗?

2个回答

您可以将市场视为基于树(使用决策树作为弱学习器)集成模型(例如随机森林或梯度提升)中的分类特征。一些应用是:

在我们继续为所有市场创建单一模型之前,请检查以下几点。如果满足以下所有点,那么我们可以轻松地为所有市场创建单一模型。

  1. 时间序列数据是否具有相同数量的信息(以年计)
  2. 检查所有市场的固定装置是否相同?
  3. 检查所有市场的季节性是否相同?

如果您觉得每个市场的数据季节性都在变化,那么请尝试使用标准化来减少它。

完成标准化后,我们需要检查所有市场的季节性是否相同?他们开始开发模型并随机检查至少 100 个国家的 Rsquared 或 MSE 值。

从 ARIMA 或 Holtwinters 等小型模型开始,而不是 LSTM。

如果您觉得 100 个国家/地区中有 80 个国家给出了相同的答案,那么请继续与所有国家/地区核实。

在创建模型之前始终尝试探索数据