我有以下变量以及几年前的销售数据:
- date # 简单的日期,可以拆分为年、月等
- shipping_time (0-6 周) # 0 周表示有货,更多周表示产品缺货但货物正在运往仓库的途中。更长的运输时间对销售有显着影响。
- sales # 售出的产品数量
我需要在考虑运输时间的同时预测销售额(季节性变化)。什么是能够产生合理结果的简单回归模型?我尝试了仅使用日期和销售额的线性回归,但这并没有考虑季节性,因此预测相当弱。
编辑:作为准确性的衡量标准,我将从输入中提取随机数据样本并与结果进行比较。
如果可以在 python/scipy 中轻松完成,则加分
数据可能如下所示
--------------------------------------------------
| date | delivery_time| sales |
--------------------------------------------------
| 2015-01-01 | 0 |10 |
--------------------------------------------------
| 2015-01-01 | 7 |2 |
--------------------------------------------------
| 2015-01-02 | 7 |3 |
...