使用哪个指标对二元逻辑回归进行分类
数据挖掘
机器学习
逻辑回归
2022-02-11 17:47:40
1个回答
性能度量应该与您面临的实际问题相关。(想象一下,你是一名足球教练。你正在寻找年轻人才,将他们介绍给你非常昂贵的训练营。对你来说,防止孩子的开支可能更重要,因为证明没有像希望的那样有才华,而不是通过该计划触及所有隐藏的人才。因此,您可能对预先评估的高度精确性感兴趣。但如果您不必关心资金,您的优先级可能会改变。您可能更感兴趣的是找到任何最后一个有才华的孩子。然后你会对回忆更感兴趣。)
如果您想要良好的概率预测,请使用 logloss。如果您希望预测分数在类别之间很好地分开,请使用 RO 曲线下的面积。您的选择应取决于您在现实世界中错误分类或错误预测的成本。
平均值仅仅是类特定统计数据的聚合。这对于多类问题最有用。对于两个班级问题,我建议改为查看班级特定的统计数据。无论如何,如何进行平均,您可以在这里阅读: https ://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html
其它你可能感兴趣的问题
