预测客户今天购买的概率

数据挖掘 预测
2022-03-03 04:57:24

我公司销售的单一产品是一种商品。如果你买了它,我可以肯定你会在不久的将来从我或我的竞争对手那里再次购买它。需求受天气影响。如果我们有高温,我的产品销量就会下降,反之亦然。

我每次销售都有以下数据:

  • 顾客
  • 销售当天平均气温
  • 交易中购买的产品数量
  • 客户仓库规模
  • 购买时的价格
  • 销售时间戳

问题:

我想根据历史时间序列数据,获得客户今天需要我的产品的概率。我想要一个%。根据历史数据,客户 X 今天有 70% 的概率需要您的产品。有了它,我可以得到一份今天有 80% 或更高概率购买并采取行动的所有客户的列表。

我看到的复杂性:

  • 我有很多数据,因为我有很多客户,但对于单个客户,我平均只有 5 次购买。

  • 如果客户不忠诚并且从我的竞争对手那里获得产品,我就会有漏洞,导致销售间隔不规则的时间跨度。

什么是解决这个问题的好算法?

我考虑过使用时间序列进行回归,但我不会得到概率。也许在我的训练集中转换每个客户重新购买的时间戳,并尝试根据购买之间的天数进行聚类。

1个回答

您可以将问题构建为生存分析 - 预测特定时间段内事件的概率。

数据质量问题会影响建模。您必须决定是为每个客户拟合一个模型,还是为一组客户拟合一个模型。丢失的数据将不得不被忽略、显式建模、删除或估算。