我有一个数据集,如:
did_purchase action_1_30d action_2_20d action_2_10d ....
False 10 20 100
True ....etc
Wheredid_purchase显示客户是否购买,列表示在购买(或非购买)事件之前采取的行动量。
因此,对于第一行,客户在购买事件发生后的 30 天内执行了 10 次 action_1,但最终没有购买。
我一直在使用 sklearn 的 LogisticRegression 来预测did_purchasefalse/true,并且可以得到大约 89% 的准确率,这很好。
但是,我想要一个百分比意图分数。所以可以说user-321 has a 46% chance of purchasing in the next 10 days.
什么是一个好的算法/方法?