想象以下场景。
训练一个分类器,将对象分类为以下 n+m 个类之一:
class 1..n -> triggers an action A depending on the predicted class p
class n+1..n+m -> triggers an action X independent on the prediction
使用的CalibratedClassifierCV
是LinearSVC
的scikit-learn
。因此,预测基于最大值predict_proba
。
问题
因为动作 X 独立于预测,所以我很想将 m 个类 (n+1, n+2, ..., n+m) 组合成一个类(以提高训练速度、分类速度、内存消耗ETC。)
这会损害分类结果吗?