预测客户购买

数据挖掘 机器学习 数据挖掘 预测建模
2022-02-16 22:34:00

假设我们有一个分为 10 个类别的产品列表。我们也有客户的订单详情,例如

order_id、product_name、数量、order_date

我们想知道某个客户month最有可能categories从哪个客户那里购买产品。我们如何解决这个问题,任何建议。

2个回答

我建议使用 LSTM RNN 或 CNN 算法根据过去的购买历史来挑选当月最受欢迎的产品。我为美国在线购物网站lands'end创建了一个有效的产品排名模型。

为了实现此解决方案的目标,您需要执行几个步骤。

  1. 收集数据集

    我想你已经为这部分收集了数据集。

  2. 处理数据集以进行监督学习。

    • 清理数据集 - 请删除包含 NaN 列的行
    • 将产品映射到眼睛 - 您需要将类别和产品映射到元素为 1 和 0 的行矩阵中。
    • 标准化 - 您需要将所有实数重新缩放为 [0, 1]
    • 将数据集拆分为训练数据、有效数据和测试数据。
  3. 构建像 LSTM RNN 这样的深度学习模型

    • 选择深度学习框架。我推荐TensorflowKeras
    • 设置模型的尺寸。即层数,每层神经元的数量。
    • 优化器,指标
  4. 训练模型和测试

  5. 按月获取该类别的预测排名。

Protip:获得更好结果的最重要的事情是哪一列将被设置为排名的输出。您应该按月或按周汇总每个产品或每个类别的总购买量。

根据您的描述,有一个自变量(月份,您可以从订单日期中提取此信息)和响应变量,即购买特定类别产品的概率。您可以使用简单的贝叶斯 (Naive) 算法来拟合模型并对指定月份进行预测。你不能做的比这更多。

但是,如果您有特定客户的可用历史数据,那么您可以构建一个推荐系统,尝试为每个客户制作个人资料,并预测在特定月份最有可能购买的东西。(用户之间的相似性或项目之间的相似性)