将诸如各种 SVM 之类的二元分类器应用于多标签数据的常用方法是一对多,它假设标签是独立的,并且在出现预测错误的情况下,我们不关心不正确的预测应该输出什么标签。
但是假设我想预测一个从 1 到 5 的分数,并且我更愿意犯错更接近事实,那我该怎么做呢? vs浮现在脑海中,因为在这种情况下,更接近的标签将有更大的训练数据重叠,但它在理论上是合理的吗?具体来说,整体性能是否会受到影响?更一般地说,在这种情况下我可以采用哪些最先进的技术?
将诸如各种 SVM 之类的二元分类器应用于多标签数据的常用方法是一对多,它假设标签是独立的,并且在出现预测错误的情况下,我们不关心不正确的预测应该输出什么标签。
但是假设我想预测一个从 1 到 5 的分数,并且我更愿意犯错更接近事实,那我该怎么做呢? vs浮现在脑海中,因为在这种情况下,更接近的标签将有更大的训练数据重叠,但它在理论上是合理的吗?具体来说,整体性能是否会受到影响?更一般地说,在这种情况下我可以采用哪些最先进的技术?