选择正确的模型来预测需求

数据挖掘 机器学习 模型选择 预测
2022-02-17 11:38:18

我们有一个包含 300,000 多条记录的数据集,如下所示:

Item ID, Quantity 2017, Quantity 2016, Quantity 2015, Quantity 2014, Quantity 2013
1111, 100, 50, 25, 10, 0
2222, 0, 10, 100, 500, 1000
3333, 10, 0, 5, 2, 4

我们目前正在尝试根据每条记录的先前数量找到预测 Quantity 2017 的最佳模型。我们已经尝试过决策树回归、多元线性回归和随机森林回归(10、100、1000 棵树),但我们的结果离批准有点太远了。我们将 80% 的数据用于训练,20% 用于测试。

有没有更适合这种计算的模型?

我们还担心,也许我们的数据结构是问题的一部分,我们应该重新评估。还有其他可能更好的结构吗?

1个回答

在我看来,这些数据实际上是一个时间序列。因此,您可以这样对待它们。

现在,有许多方法,每种方法都有自己的优势/劣势。我会从简单的模型开始,例如 ARMA 或 SARIMA。可能还有 GARCH 或 VAR。如果你想追求更高级的东西,循环神经网络也用于时间序列预测。

除此之外,令我惊讶的是,例如随机森林没有提供足够的性能。您是否尝试过彻底的功能选择?可能是你的期望太高了。