使用机器学习创建营销细分

数据挖掘 机器学习 r
2022-03-09 12:05:48

我正在做一个项目来尝试预测哪些用户最有可能订阅我们的服务。我正在使用 R 并且正在处理一个数据框,该数据框包含用户的电子邮件地址、有关他们过去购买的信息(订单数量和产生的收入)、他们如何与我们的网站交互(触发了不同的事件)以及他们是否已订阅。我正在使用这些数据来训练和测试不同的算法。我已经将插入符号与 knn、lda、cart 和 nnet 一起使用。

我已经能够了解我的模型有多准确,但这并不能帮助我知道向谁推销。当我将新数据插入我的模型时,我想知道它认为哪些用户最有可能订阅,并给我他们相关的电子邮件地址。我已经查看了所有内容,但找不到任何可以帮助我将预测与电子邮件地址配对的内容。任何帮助将非常感激。

PS。

我没有使用电子邮件地址对数据进行分类。我只是让他们将一行数据与用户相关联。我必须摆脱它们以通过训练和测试算法运行它,这就是我遇到的问题,即知道哪些预测数据与哪个电子邮件地址以及哪个用户相关联。

4个回答

哇,真是个好问题!对于在营销职能中使用数据的任何人来说,这都是一项关键任务。

首先,我将解决您关于将预测与电子邮件配对的问题。您的电子邮件用作唯一标识符。当您拆分数据集时,您必须保留电子邮件并将其从预测中抑制,并使用它来匹配/比较验证数据。

如果这些是新的预测,您可以在数据中创建一个包含“预测”值的新列。这个过程的细节将更适合另一个社区,可能是 StackOverflow。

其次,我想谈谈你想要达到的目标。

我认为有两个问题可以通过你已经完成的工作来解决这个问题:

  1. 确定谁最有可能订阅,并将您的精力集中在创建培育活动以“温暖”这些潜在客户。最终目标是获得订阅。

    在这里,您将使用您提到的那些“事件”。你到底有什么?在过去。我刚刚转储了网络活动数据并开始使用它。您必须设计许多功能来捕获您的网络活动不会报告的信息(这些可能是登录次数、结帐次数、自上次访问以来的时间,这是您需要发挥创意的地方)。

    获取这些数据并尝试预测谁可能订阅。在某些销售行业中,这被称为领先分数。

    由于您使用的是 R,您可以尝试使用XGBoost- https://cran.r-project.org/web/packages/xgboost/vignettes/xgboostPresentation.html由于您正在尝试预测二元变量,因此您可以使用他们的决策树。

    这将需要一段时间,所以如果您在第一周(或第一个月)没有将其投入生产,请不要感到沮丧。这里有一些阅读:

    https://datastories.com/gallery/predictive-user-scoring-example

    https://machinelearningmastery.com/discover-feature-engineering-how-to-engineer-features-and-how-to-get-good-at-it/

    https://rdatascientist.wordpress.com/2015/01/26/predictive-lead-scoring-using-r-first-of-a-two-part-blog-series/

  2. 确定您想要获取的客户类型,并专注于开展活动以吸引这些类型的客户这里的最终目标是获得优质客户。

    这比机器学习更具营销和战略意义。不要误会我的意思,识别集群有机器学习。这是我使用的一个很好的例子:http ://www.kimberlycoffey.com/blog/2016/8/k-means-clustering-for-customer-segmentation 。

    一旦您确定了不同的细分市场及其表现出的行为,您就必须与其他利益相关者合作并尝试确定您想要什么样的客户?与每年进行五次小额购买的客户相比,获得一年购买一次大宗商品的客户有什么好处?您必须花时间确定最有价值的客户/潜在客户,并围绕此制定策略。

在选择任何特定方法之前创建一些数据的可视化是一个好主意。从这里开始,您可能会看到一些有用的趋势!

对于初学者,我可能会从逻辑回归中创建一个二元分类器。提供一部分用于训练的数据,看看它在其余部分的表现如何。这是最简单的方法之一,可以很好地工作。

您可能希望从电子邮件地址中提取某些特征:

像提供商、名称等。只有电子邮件地址元信息*可能也是如此。

如果您不想使用电子邮件地址而只是映射它,您可以简单地使用条目映射到电子邮件地址。

如果您对数据进行聚类并检查每个集群的 RFM(新近度、频率、货币)值或订阅比率,这将是有意义的。然后根据您的预算定位最佳集群并检查其电子邮件地址域或位置(来自 IP)。然后是对您的营销计划的讨论和优化。