我正在做一个项目来尝试预测哪些用户最有可能订阅我们的服务。我正在使用 R 并且正在处理一个数据框,该数据框包含用户的电子邮件地址、有关他们过去购买的信息(订单数量和产生的收入)、他们如何与我们的网站交互(触发了不同的事件)以及他们是否已订阅。我正在使用这些数据来训练和测试不同的算法。我已经将插入符号与 knn、lda、cart 和 nnet 一起使用。
我已经能够了解我的模型有多准确,但这并不能帮助我知道向谁推销。当我将新数据插入我的模型时,我想知道它认为哪些用户最有可能订阅,并给我他们相关的电子邮件地址。我已经查看了所有内容,但找不到任何可以帮助我将预测与电子邮件地址配对的内容。任何帮助将非常感激。
PS。
我没有使用电子邮件地址对数据进行分类。我只是让他们将一行数据与用户相关联。我必须摆脱它们以通过训练和测试算法运行它,这就是我遇到的问题,即知道哪些预测数据与哪个电子邮件地址以及哪个用户相关联。