我公司销售的单一产品是一种商品。如果你买了它,我可以肯定你会在不久的将来从我或我的竞争对手那里再次购买它。需求受天气影响。如果我们有高温,我的产品销量就会下降,反之亦然。
我每次销售都有以下数据:
- 顾客
- 销售当天平均气温
- 交易中购买的产品数量
- 客户仓库规模
- 购买时的价格
- 销售时间戳
问题:
我想根据历史时间序列数据,获得客户今天需要我的产品的概率。我想要一个%。根据历史数据,客户 X 今天有 70% 的概率需要您的产品。有了它,我可以得到一份今天有 80% 或更高概率购买并采取行动的所有客户的列表。
我看到的复杂性:
我有很多数据,因为我有很多客户,但对于单个客户,我平均只有 5 次购买。
如果客户不忠诚并且从我的竞争对手那里获得产品,我就会有漏洞,导致销售间隔不规则的时间跨度。
什么是解决这个问题的好算法?
我考虑过使用时间序列进行回归,但我不会得到概率。也许在我的训练集中转换每个客户重新购买的时间戳,并尝试根据购买之间的天数进行聚类。