用置信度分数或意图百分比分数预测 X 的意图?

数据挖掘 逻辑回归
2022-03-11 23:19:24

我有一个数据集,如:

did_purchase  action_1_30d action_2_20d action_2_10d ....
   False            10          20            100
   True            ....etc

Wheredid_purchase显示客户是否购买,列表示在购买(或非购买)事件之前采取的行动量。

因此,对于第一行,客户在购买事件发生后的 30 天内执行了 10 次 action_1,但最终没有购买。

我一直在使用 sklearn 的 LogisticRegression 来预测did_purchasefalse/true,并且可以得到大约 89% 的准确率,这很好。

但是,我想要一个百分比意图分数。所以可以说user-321 has a 46% chance of purchasing in the next 10 days.

什么是一个好的算法/方法?

1个回答

您可以使用LogisticRegressionspredict_proba方法输出的概率。

几乎所有的分类器都会在 sklearn 中给你一个概率。一个例外是支持向量分类器,它将为您提供到决策超平面的点距离,这可以解释为置信度(您可以获得支持向量分类器的概率,但它是通过计算成本高的交叉验证过程)。