时尚零售数据的销售预测

数据挖掘 神经网络 r 预测建模 回归 随机森林
2021-09-29 07:31:11

我正在从事与基于先前数据的销售量预测相关的项目。数据由 .MRP、尺寸、折扣、颜色、面料类型等属性组成。我在数据中同时拥有销售数量和袜子。目前我正在尝试使用随机森林算法(在 R 中)预测销售数量。

我做了一些基本的特征转换,比如一个热门的分类变量,并对数据进行归一化并训练模型。在这里,我在数据方面遇到了一些问题。我执行了下面列出的一些操作

  1. 我有两个不同的数据集,一个包含销售记录,另一个有库存。我们每周都在匹配和汇总记录。在某些情况下,现有库存不可用,但发生了销售。对于那些将销售数量作为现有库存的记录。

  2. 对于未售出的记录,我们没有任何折扣。为了保持折扣,我们对其他商店的特定商品在同一时期内平均折扣(客户建议)。

    1. 一些记录在聚合后具有负销售数量。我们正在使那些负销售额为零。

    2. 为了训练模型,我的未售商品的销售数量为“0”(零)。在数据中,未售商品比已售商品多(例如,如果已售商品为 20,则未售商品约为 300)

我没有得到任何可观的结果。我也在 R 中用 **Neural Network ** 尝试了同样的事情。

我是预测建模的初学者。这是我的第一个项目。如果我的方法有任何问题,请纠正我

1个回答

如果这是您的第一个项目,请从简单的东西开始 - 例如线性回归,lm(sales ~ data). 一旦你启动并运行它,你就可以尝试更复杂的东西。

我建议在销售预测中避免使用神经网络——神经网络很有吸引力,但需要大量数据才能正确训练。这在销售预测环境中通常是不可行的。