我正在从事与基于先前数据的销售量预测相关的项目。数据由 .MRP、尺寸、折扣、颜色、面料类型等属性组成。我在数据中同时拥有销售数量和袜子。目前我正在尝试使用随机森林算法(在 R 中)预测销售数量。
我做了一些基本的特征转换,比如一个热门的分类变量,并对数据进行归一化并训练模型。在这里,我在数据方面遇到了一些问题。我执行了下面列出的一些操作
我有两个不同的数据集,一个包含销售记录,另一个有库存。我们每周都在匹配和汇总记录。在某些情况下,现有库存不可用,但发生了销售。对于那些将销售数量作为现有库存的记录。
对于未售出的记录,我们没有任何折扣。为了保持折扣,我们对其他商店的特定商品在同一时期内平均折扣(客户建议)。
一些记录在聚合后具有负销售数量。我们正在使那些负销售额为零。
为了训练模型,我的未售商品的销售数量为“0”(零)。在数据中,未售商品比已售商品多(例如,如果已售商品为 20,则未售商品约为 300)
我没有得到任何可观的结果。我也在 R 中用 **Neural Network ** 尝试了同样的事情。
我是预测建模的初学者。这是我的第一个项目。如果我的方法有任何问题,请纠正我