假设我有 10,000 个客户,我希望在我的下一个活动中有 100 个响应者,并且有预算向 5k 发送一封信。
我有过去回复的人花了多少钱的数据,我有兴趣从我的 5k 封信中获得最多的美元(即理想情况下,我找到了 100 个回复者,但如果没有,我想找到那些留下更多钱的人) .
我创建了一个回归模型和一个分类模型(如果他们花钱,则为 1 - 即在过去做出回应 - 否则为 0)。运行机器人模型后,我发现在 10k 的测试样本中,如果我选择按概率(用于分类模型)和回归中的预期数量排序的前 5k,回归模型表现更好(不评估有多少响应者他们找到了,但他们从被选中的人中找到了多少)。
根据我的上下文数量是否有意义?我曾预计分类模型会表现得更好,但无法弄清楚为什么回归模型在我的示例中名列前茅。
非常感谢你!!