我正在构建一个有监督的机器学习模型来生成预测。
所以我会有这样的历史数据:
SKU, Month, .... other features, Actual Volume
我可以使用模型来生成预测,使用实际数量作为标签。
当然,预测量和实际量之间会有差异
在不产生任何数据泄漏的情况下,利用这些数据来整合这些信息来训练模型以最小化方差的正确方法是什么?
数据应该通过移动平均等方式反馈给数据并重新训练,还是有其他更好的策略来正确评估模型的性能并从中学习?
数据将是具有各种特征的时间序列数据,例如汇率、销售人员等。