如何预测客户是否会续订

数据挖掘 统计数据 分配 擅长 搅拌
2021-09-23 14:32:45

我有一个客户合同数据集,其中指定了开始日期和结束日期(如果适用)。每个月都有一个客户需要续订。以下是如何在 excel 中组织数据的示例:

ID   Customer Start Date   Customer Drop Date
1    Jan. 2018             Dec. 2018
2    Feb. 2018             July 2018
3    Mar. 2018             

使用上面的示例,我试图预测客户 3 是否会在 2019 年 1 月、2019 年 2 月、2019 年 3 月等下降。本质上,我试图计算仍然活跃的客户将更新他们的概率2018 年 12 月之后给定月份的合同。剩余的生命周期价值是多少?

我应该绘制所有历史合约的长度并查看它们匹配的分布吗?如果是这样,我将如何将分配应用于未结合约?

3个回答

您正在尝试做的事情称为流失预测。不幸的是,您拥有的数据集不足以训练模型。您需要各种不同的功能来构建正确的预测模型。

例如,您需要客户的人口统计数据,但最重要的是与客户行为相关的数据。例如,如果您有一家移动网络公司,您可能需要以下功能:

  1. 年龄
  2. 性别
  3. 国家

  4. 每日使用情况(通话分钟数、SMS 或移动数据)

  5. 前一天使用情况
  6. 手机套餐(合同详情等)

一般来说,你拥有的关于你的问题的数据越多,建立这样一个模型就越容易。

我同意 Tasos,您需要有关客户的更多信息,客户居住在哪个区域。仅根据历史更新数据训练模型根本不是一个好的可预测模型,因为它没有考虑不同客户的独特性。它根本不会预测好或非常错过和命中预测。

首先,您需要了解(或在此处解释)您的业务类型。根据您所说,这似乎是一个基于订阅的“合同业务”。因为,这些类型有不同的解决方案。识别这一点将帮助您在 Google 上有效地查明和搜索解决方案。更多信息可以在这里找到 在此处输入图像描述

此外,您需要解释问题并回答几个问题。即

  • 在历史订阅数据中,平均客户有多少订阅?就像他们每月支付的水电费一样吗?
  • 客户一生中退订一次或多次(只需查看最近 3-4 年的数据)是否很常见?

此外,如果这些事情是未知的,那么除了订阅之外,您还需要有关客户的其他重要信息(如@Tasos 所说)。

以下是一个Python 库,它适用于非合同性质的企业。