我正在尝试创建一个模型来预测下周将要出售的不同杂货商品的单位。
我以三步程序构建问题。
- 将来自宏观类别的销售数据组合在一起(例如,如果我想预测“蛋盒 XYZ”,我将考虑“鸡蛋”类别中的所有项目),将每天该类别所有项目的销售数据相加。然后我用先知来预测整个品类下周的销售数据。我正在执行此步骤,因为“整个类别”数据具有更多历史记录,并且与单项数据相比应该更强大。
- 在特定项目上实施先知模型。我预计误差会更高,因为数据不太一致。
- 使用特定日期的输入变量对单个项目实施回归器(可能是 GradientBoost、RandomForest 等):该项目的前一周销售数据、整个类别的预测销售单位、预测单位(再次使用先知) ) 对于特定项目,我们是否在一年中的特定时间(例如节礼日),促销活动等。这个回归器背后的想法是抑制第二步的错误。但是我不能降低第二步的错误。
我该如何解决这个问题?