希望在营销数据上建立一个响应模型(点击或不点击),该模型向一个人显示不同数量的报价。我不想模拟他们点击了哪些优惠,但他们是否点击了提供给他们的任何优惠。我的问题是如何处理不同数量和类型的报价?
示例数据可以是一张 id 表:
id clicked
001 1
002 0
003 1
每个 id 的优惠数量不同:
id discount_rate on_amt
001 0.05 100
001 0.10 500
002 0.03 50
003 0.05 100
003 0.10 300
003 0.15 500
我是否从报价数据集中创建特征,例如平均折扣率、最大 on_amt 等?或者创建一个非常大的分箱报价类型的二进制稀疏矩阵,例如 rate_5-10_amt_0-50 1/0 和 rate_5-10_amt_50-100 1/0 ...?
还是有一个很好的模型可以处理这样的可变数据?