如何识别准备转换为付费的潜在客户?

数据挖掘 机器学习 r
2022-02-18 05:07:52

我的数据具有在我的工具上执行的操作,我想预测准备从免费/跟踪转换为付费类别的客户。

我的数据如下所示:

dummy<-data.frame(license=sample(c("Free","Trail","Paid"),10000,replace = T,prob = c(0.6,0.35,0.05)),
           plan_type=sample(1:5,10000,replace=T),
           action1=sample(0:100,10000,replace = T),
           action2=sample(0:1000,10000,replace = T),
           action3=sample(0:10,10000,replace = T),
           num_days_in_product=sample(0:500,10000,replace = T))


head(dummy)
  license plan_type action1 action2 action3 num_days_in_product
1    Paid         1     100      71       5                 285
2    Free         5      75     438       1                   2
3    Free         1       5     555       7                 389
4    Free         3       4     105       0                 150
5    Free         1      16     348       7                 423
6    Free         5      15     866       8                 270

> table(dummy$license)

 Free  Paid Trail 
 6016   516  3468 
> prop.table(table(dummy$license))

  Free   Paid  Trail 
0.6016 0.0516 0.3468 

让我知道是否需要任何额外信息。

1个回答

想到两个项目:

  1. 当您提出模型并让其他人评论和修改模型时,您将从该站点获得最大的收益。就目前而言,您只是在提议您的数据是什么样的。您有尝试过的模型吗?您的项目已经采取了哪些数据科学步骤?如果您发布该内容,该网站将对您有更好的帮助
  2. 您应该知道,您发布的内容构成了一个良好的初始数据集,但仅此而已,您的初始集。如果我处于你的位置,我将致力于开发一个包含更多因素的元数据集。这个人什么时候加入的?动作之间的时间是多少?他们的 IP 地址来自哪个国家/地区?他们登录该工具多少次?等等,等等,等等。当你开始以这种方式思考你的数据,并给自己更多的因素开始时,那么你正在采取的步骤更有可能产生一个可靠的预测模型。