例如,我为一个邮件活动构建了一个分类模型,该模型将应用于 1M 条记录。该模型的正面类别将是客户,而负面记录将是非客户。
对于邮件,我们选择前 100,000 条得分(最高预测概率)记录。我们预计回复率较低,但我们希望确保将邮件发送给所有预测最高的潜在客户。
我们将模型分数分成十分位数,并且只从十分位数 1(最高得分)中选择,我们会说它是 >= 0.10 的预测概率。该模型在此阈值处具有 95% 的召回率和 5% 的准确率。
在这种情况下获得尽可能高的召回率是否有意义?或者精度在这里很重要,我应该对此进行优化,或者只是一起优化它们。
我们的目标是在这 100k 中获得最多的客户转化,我们已经知道会有大量的误报,但我们希望尽可能多的真阳性。