我想问一个案例,我们想预测某个输入变量的最佳类别,以便最大化事件的概率。
例如给定客户的广告类型,这将最大化购买概率。在收集的数据中,我们有许多不同的广告类型、客户描述和购买与否的信息。
我想到的一种解决方案是将广告类型视为输入变量,训练常规概率模型,然后使用所有广告类型配置进行预测,然后选择一个给出最佳估计的。
还有哪些其他选择?
我想问一个案例,我们想预测某个输入变量的最佳类别,以便最大化事件的概率。
例如给定客户的广告类型,这将最大化购买概率。在收集的数据中,我们有许多不同的广告类型、客户描述和购买与否的信息。
我想到的一种解决方案是将广告类型视为输入变量,训练常规概率模型,然后使用所有广告类型配置进行预测,然后选择一个给出最佳估计的。
还有哪些其他选择?
在您的方法中,您将构建一个模型,将输入特征(广告类型、客户描述符)映射到输出(购买量 = 0/1)。您可以使用逻辑回归等模型,或决策树(可以对广告类型和客户描述符之间的交互效果进行建模)。这似乎是合理的,并且是广告选择常用的方法之一。
基于客户相似性的其他一些选项:
基于近邻的方法:根据客户描述符,识别当前客户的相似邻居。计算所有相邻广告类型的转化概率,然后选择转化概率最高的广告类型。
基于集群的方法:根据客户描述符形成客户集群。将当前客户映射到其中一个集群中,然后选择能够使该集群的转化概率最大化的广告类型。
关于使用这样的模型设计广告选择系统,系统探索空间的新区域也很重要,因此一些小的随机预测将在这里有所帮助。
如果要预测输入变量的最佳类别,为什么不将输入变量本身作为输出呢?并说出事件是否正在发生的概率或布尔值作为输入。我猜有足够的训练数据,它可能预测正确。但这可能不是一个理想的解决方案,因为您已经将模型指定为事件发生的最佳类别,因此您的方法是更好的方法。
当您正在寻找给定另一个变量的条件分布时,会想到图形模型。