二元分类与一类分类

数据挖掘 分类 支持向量机 二进制
2022-03-09 04:42:10

如果一类算法只需要一类样本就可以完成工作,为什么我们需要两类样本来训练二元分类算法?

我知道一类算法(如一类支持向量机)是在没有负数据的情况下提出的,并且他们试图找到将正样本(A)与负样本(非 A)分开的决策边界。

因此,传统的二元分类问题(例如在 (A) 和 (B) 之间)可以表述为 (A) 和 (不是 A = B) 的分类。是关于更好的分类结果还是我遗漏了什么?先感谢您

2个回答

当要求将数据捕获到两个类别时,需要进行二进制分类。如果你不能在两个只需要一个的类中捕获数据,你就去 One-class。您可以查看此链接以获得更好的解释 http://rvlasveld.github.io/blog/2013/07/12/introduction-to-one-class-support-vector-machines/

如果您采用二元分类,则 svm 会尝试在 A 和 B 之间找到最佳空间。如果只有一个类,A 模型会尝试在其周围创建边界并进行分类。以患者疾病分类为例:对于 +ve 一些症状 t1, t2, t3, t4, t5 对于 -ve 他有 t1, t2, t7。在上述情况下,很难使用一个类别进行分类,因为模型将具有 t1、t2 的患者分类为 +ve,因为接近 +ve 类别。第二个标签为您提供更多信息以进行更好的分类。

我认为这就是你要找的:

二元分类器用于将实例分类为两个类之一,而对一个类问题使用二元分类器的原因是实例要么属于该类,要么不属于该类。例如,如果您的问题是预测明天是否会下雨。所以明天要么下雨,要么不下雨。另一个例子是给定一张图像,你的分类器任务是预测它是否是男性。虽然你只关心一个是男性的班级,但仍然有两个班级,即男性或非男性(男性)。

因此,在为一个类训练分类器时,您的数据应该是该类的实例加上非该类的实例。因此,您的分类器能够准确地对实例进行分类,无论它是否属于该类。

如果您想知道其他任何事情,请告诉我。我很乐意帮助你。