对于工业中的多标签(不是多类)问题,有哪些好的错误指标?

数据挖掘 分类 scikit-学习
2022-03-01 06:37:36

对于工业中的多标签(不是多类)问题,有哪些好的错误指标?

http://scikit-learn.org/dev/modules/multiclass.html

1个回答

一个常见的例子是 Jaccard 相似系数:

J(Y,P)=|Y  P||Y  P|

在哪里P是一个实例的预测标签集,并且Y是真正的标签集。这给出了之间的值01对于每个实例,您可以对整个测试集进行平均以给出分数。如果P=Y, 然后J(Y,P)=1.

这是在scikit-learnas中实现的sklearn.metrics.jaccard_similarity_score