使用的模型 预测下一次购买的时间

机器算法验证 r 机器学习 时间序列 数理统计 生存
2022-04-02 02:11:39

我有 12 年的用户交易历史。我想在 R 中预测下一次购买的时间。我们可以使用回归模型来预测这个连续值(以月为单位)。如果是这样,目标变量是什么?我有每个客户的购买频率和新近度。

感谢任何建议或参考。

4个回答

基本策略是假设活动是根据某个分布族分布的,然后根据数据估计参数。这并不是真正的回归,因为特征变量和响应变量基本相同。此外,真正的基本分析将仅基于每个客户的活动来估计每个客户,尽管更高级的分析可能会调整预期的分布系列,或者根据平均客户的行为对参数的期望进行加权。

如果您有其他变量,例如交易的美元金额,或者如果您不假设独立(例如,可能在周末购买大量商品的人的行为与其他人不同),那么您可以进行回归这些因素和参数之间的分析。

这取决于您想要使用什么以及您想要做出什么样的假设。如果您假设购买是随机独立的,那么您正在寻找Poisson Point Process可在此处找到可访问的介绍。

更一般地说,指数分布预测连续事件之间的时间。如果您了解决定时间间隔的变量是什么,则可以使用指数回归(感谢评论!)

如果您对数据没有任何见解以允许您使用指数回归或泊松点过程,您可以构建一个 ML 算法来模拟客户的购买行为,然后您可以研究模拟以确定答案。

这是生存分析的一个例子,是的,可以通过回归来完成。您可以从Wikipedia开始。从弄清楚如何创建 Kaplan Meier 曲线开始,如果您从未听说过这个领域,可以将其与某些子组进行比较。

这是点过程建模。使用回归的一种简单方法是将下一次购买间隔作为历史和其他协变量的函数进行回归。通常,您可以拟合条件强度函数的参数形式。神经科学中一个流行的选择是使用线性-非线性函数形式。