定义流失用户的数据驱动方法

数据挖掘 机器学习 预测建模 生存分析 搅拌
2021-10-11 17:52:05

我正在尝试为在线服务(投注/赌博)定义流失预测模型。很多论文都在讨论电信公司的流失分析/预测,其中定义流失用户很简单:流失用户是取消合同的用户。我想知道如何在用户不取消任何合同/帐户的行业背景下定义流失用户?

我可以设想一个通用的方法:如果一个每天玩一个月的用户停止玩 2 天,这可能会被标记,但一个每周只玩一次然后 2 天没有活动的用户不会。以算法方式编码此逻辑的最佳方法是什么?是生存分析和好方法吗?

3个回答

另一种方法是将“流失”(又名“服务的减少使用,包括不使用”)建模为一个过程,而不是一个事件。多年前,在保留营销中,这被称为“流失漏斗”,以反映客户获取方面的“销售漏斗”(怀疑 -> 潜在客户 -> 试用客户 -> 回头客 -> 忠实客户)。所以一个背叛漏斗可能看起来像这样:

忠诚/常客 -> 不满意的客户 -> 不常客 -> 非客户

将其标记为“漏斗”是恰当的,因为每个阶段的子集都会进入下一个阶段。并非所有“不满意的客户”都会变成“不常来的客户”,等等。

定义背叛漏斗有两个关键。首先,定义整个漏斗的行为特征,以及漏斗中每个阶段(类别)的行为特征。在您的情况下,它可能是熟悉的 RFM(“新近度”“频率”和“货币”)分数的变体。其次,您需要确定其他表现出从一个阶段转移到另一个阶段的倾向的行为特征或模式。这些可能包括:投诉、成为拖钓的受害者、经历服务中断、经历投注损失、他们使用服务的时间,或者可能只是人口统计数据。

有了这些定义,您就可以建立一个预测模型,并随着时间的推移跟踪每个类别中的客户数量。


顺便说一句,这种方法不依赖于将漏斗划分为“阶段”,从根本上说你有多少阶段也没有关系。但是,定义离散阶段有许多实际好处,包括将您的模型和结果传达给其他不具备定量或统计意识的人。

首先,我想说 Dirk 基本上是正确的,即生存分析不必对死亡进行建模,它与在群组分析中查看用户组的方式基本相同。但是,对于特定的个人行为活动,例如欺诈管理,它是不可靠的。收入分析和趋势预测是生存模型的重要用途。

话虽如此,个人行为的情况并非没有希望,只是不是那么直截了当。在一家移动公司的预付卡账户中遇到过类似的情况……您可以按照您尝试的方式对个人的行为进行建模,将其建模为流程控制问题,然后遵循良好实践。通过随机抽取个人行为(使用)的数据(重要)并将其与其他用户的类似行为(环境因素归一化)进行比较,并查看控制点,在一个时期内超过 3 个连续失控点或超过8 整体是基础设置。然后,这可以为您提供一组“可疑”潜在的“流失或欺诈”活动,然后可以对其进行分析和标记以训练更好的模型。

希望这会有所帮助:)

您应该首先定义您已经开始的流失事件。是全球性的还是个人性的?是3个月没赌了还是改变了格局?全球更适合建模。您可以为此使用生存模型。