我是否需要使用贝叶斯将样本的类概率与整体模型的性能相结合?

数据挖掘 分类 可能性 评估
2022-02-25 07:29:53

对于给出每个类的预测概率的分类算法(即 sklearn 中的随机森林),默认情况下,类以 0.5 的分数分隔。在评估指标之后,看起来会有更好的精度/召回平衡来满足我的需求,并获得更高的分数。

如果我使用 0.6 分的分割,得到 0.8 的准确率和 0.9 的召回率,我如何传达未来样本分数的整体置信度?

例如,如果样本返回的预测概率为 1,而返回的概率为 0.75。根据选择的阈值,两者都将被视为正类的一部分。然而,据估计只有 80% 的时间是正确的。最重要的是,1 和 0.75 的分数似乎表明该模型的另一个置信度。

感觉这里应该使用贝叶斯来总结分数以进行解释。但是,我不确定。那么,给定模型基于分数阈值的估计性能,并给出一些分数,你如何给出实际属于正类的样本的总体百分比?以及如何将这一点传达给非技术人员?

0个回答
没有发现任何回复~