我会使用一个两步的方法,使用的想法 C4^ 你提到的课。
第一步,使用二元分类器(在整个数据集上训练)来确定样本是否属于该类 C4^(即在任何不感兴趣的课程中)。为此,如果属于“有趣”类的样本与其他样本大不相同,您还可以查看异常值检测方法。
如果结果是否定的,则继续下一步,一个新的分类器只对属于类的样本进行训练C1,C2,C3并将该预测用作您的最终预测。
我认为即使使用简单的聚类方法作为第一步(例如,使用平均质心作为初始质心值的4 聚类k均值c e n吨j=∑X一世∈ D :是的一世= jX一世∑X一世∈ D :是的一世= j1 对于每个C1,C2,C3,C4^),仍然有用。