选择正确的时间序列模型

数据挖掘 Python 时间序列 回归 线性回归 分类数据
2022-02-23 04:21:53

使用 Python,我正在尝试使用历史销售数据来预测产品的未来销售数量。我还试图预测各种产品组的这些计数。

例如,我的列如下所示:

Date Sales_count Department Item Color

8/1/2018, 50, Homegoods, Hats, Red_hat

如果我想建立一个使用历史数据(时间)预测每个部门/项目/颜色组合的 sales_count 的模型,最好使用什么模型?

如果我对销售时间进行线性回归,我如何考虑各种类别?我可以将它们分组吗?

我会改为使用多元线性回归,将各种类别视为自变量吗?

1个回答

您在说“对于各种产品组”,这就是您的答案。

独立预测每组产品,然后将组总数拆分为单个产品。采用这种策略的原因是,预测大数据比预测罕见情况更容易、更准确。另一个原因是,通过对类似产品进行分组,您有机会捕捉到新产品蚕食旧产品等细节。