基于代表性群体预测个人

数据挖掘 机器学习 预测建模 预报
2022-03-10 08:26:41

我正在尝试创建一个模型来根据随着时间的推移许多个人的历史数据来预测个人的需求/支出,但我很难找到这方面的例子。

举一个简单的例子来说明我正在尝试做的事情:

假设有一家冰淇淋店,周边地区的孩子每周都会光顾。我们拥有商店中所有购买的历史记录以及购买者的详细信息,因此我们可以跟踪每个人的购买历史记录。我们还有每个人的详细信息,例如年龄、性别、学校、编号。兄弟姐妹等

我们可以假设一个孩子每周会从商店购买一次,直到他们永远“离开”并停止购买。

我想做的是在几周内为每个孩子创建购买预测。我正在努力解决的问题是,蒂米说,一个新孩子只购买了几个星期,因此没有足够的历史来仅根据他自己的数据进行预测(但我们确实有他的详细信息) .

我的假设是通过考虑孩子的详细信息可以更好地预测需求,所以我想在历史数据中找到最能代表 Timmy 的一组,并在创建 Timmy 的预测时以某种方式利用他们的数据。此类预测是否有任何标准方法/实践?

任何建议或指导将不胜感激。

1个回答

我认为你正在做一个有监督的分类问题。您已经标记了数据 — 以前的客户,您可以将其标记为不同的组(例如高支出/低支出)以及有关客户的预测变量 — 他们的详细信息(例如年龄)。

您可以将这些客户详细信息中的每一个都视为图上的维度,而您的任务是找出不同的客户组沿着这些维度聚集在哪里。一旦您知道您可以根据他们的详细信息预测新客户可能属于哪个组。

解决这类问题的方法有很多,包括但不限于支持向量机梯度下降最近邻您选择哪一个将取决于您拥有的数据量和类型。如果你刚开始,一个非常好的指南是SciKit 学习文档中的这个流程图,它并不详尽,但提供了有用的概述。