对于社交媒体数据集上的多标签、多类分类,我们从数据集中收集了大约 5000 个样本并对其进行了手动注释。5000 个样本被 3 个人标注,其中 1500 个是相同的帖子。我现在应该如何决定类别标签?
例如,
AnnotatorId Post Labels
-------------------------
Annotator1: post1: A,B,C
Annotator2: post1: A,D,E
Annotator3: post1: B,D,E
post1 的标签是否会A,B,D通过多数投票?或者,是否有一些更好的常用方法?