跨数千家商店的多种产品的需求预测

数据挖掘 预测建模 时间序列 预报
2022-01-19 23:37:03

我目前正在处理一项需求预测任务,其中包含数千家商店的数万种产品的数据。更具体地说,我有每家商店每件商品 3 年的每日销售数据,我的目标是预测每家商店每件商品的未来销售额,提前一天;然后提前两天,等等。

到目前为止,我已经考虑将每个产品-商店对分解为一个时间序列,并对每个时间序列进行预测,就像在 Neal Wagner 的论文“在现实世界系统中预测多个时间序列的智能技术”中所做的那样。换句话说,我将仅使用特定商店的产品销售历史信息来预测该产品在该商店中的未来销售情况。

然而,我一直在浏览 Kaggle,像Corporación Favorita Grocery Sales Forecasting这样的竞赛提出了一种不同的方法,即使用来自所有商店和所有产品的信息来预测未来的销售情况。据我了解,所有商店的所有产品的历史销售信息都被转储到训练集中,模型将从中学习预测未来的销售。它与传统的时间序列方法有很大不同,但显然,根据比赛的结果,它是有效的。

后一种方法似乎很有希望并且更强大。但是,存在必须处理数亿个数据点的问题。

哪种方法更适合我的任务?对于那些解决过类似问题的人,您会推荐哪种方法?

1个回答

我也有类似的情况。我有一个包含商店数量和产品类别的数据集,我需要预测每个类别的每周销售额。您可能想要检查梯度提升算法和随机森林,它们在预测准确性方面给出了有希望的结果。此外,无论采用哪种方法,最好的办法是创建虚拟变量,因为创建单个时间序列非常耗时。