我有这个数据集。
Head(df):
ï..date store item qty unit_price item_category
1220 2017-03-15 38 295 255 13.30 13
1453 2017-03-15 41 43 291 10.08 13
3181 2017-03-15 75 186 324 28.59 13
3541 2017-03-15 42 295 133 13.30 13
3624 2017-03-15 56 127 969 55.23 13
4657 2017-03-15 52 75 121 27.23 13
4702 2017-03-15 13 413 75 18.55 13
日期列中显然有很多重复项(因为它取决于 store 和 items ,这是预期的),并且由于我的任务是进行预测并以 qty 变量的数字返回预测值 - 目标预测变量“数量”表示在 ITEM/DAY 级别销售的总数量 - 我认为我可以删除重复的日期(我将使用 ARIMA 模型)并仅保留 date 、 item 和 qty 列用于我的预测。
我想知道我的方法是否正确,任何建议将不胜感激,谢谢。