数据挖掘 - 二元分类与一类分类 - 吾爱随笔录

二元分类与一类分类

数据挖掘分类支持向量机二进制

2022-03-09 04:42:10

如果一类算法只需要一类样本就可以完成工作，为什么我们需要两类样本来训练二元分类算法？

我知道一类算法（如一类支持向量机）是在没有负数据的情况下提出的，并且他们试图找到将正样本（A）与负样本（非 A）分开的决策边界。

因此，传统的二元分类问题（例如在 (A) 和 (B) 之间）可以表述为 (A) 和 (不是 A = B) 的分类。是关于更好的分类结果还是我遗漏了什么？先感谢您

2个回答

当要求将数据捕获到两个类别时，需要进行二进制分类。如果你不能在两个只需要一个的类中捕获数据，你就去 One-class。您可以查看此链接以获得更好的解释 http://rvlasveld.github.io/blog/2013/07/12/introduction-to-one-class-support-vector-machines/

如果您采用二元分类，则 svm 会尝试在 A 和 B 之间找到最佳空间。如果只有一个类，A 模型会尝试在其周围创建边界并进行分类。以患者疾病分类为例：对于 +ve 一些症状 t1, t2, t3, t4, t5 对于 -ve 他有 t1, t2, t7。在上述情况下，很难使用一个类别进行分类，因为模型将具有 t1、t2 的患者分类为 +ve，因为接近 +ve 类别。第二个标签为您提供更多信息以进行更好的分类。

我认为这就是你要找的：

二元分类器用于将实例分类为两个类之一，而对一个类问题使用二元分类器的原因是实例要么属于该类，要么不属于该类。例如，如果您的问题是预测明天是否会下雨。所以明天要么下雨，要么不下雨。另一个例子是给定一张图像，你的分类器任务是预测它是否是男性。虽然你只关心一个是男性的班级，但仍然有两个班级，即男性或非男性（男性）。

因此，在为一个类训练分类器时，您的数据应该是该类的实例加上非该类的实例。因此，您的分类器能够准确地对实例进行分类，无论它是否属于该类。

如果您想知道其他任何事情，请告诉我。我很乐意帮助你。

其它你可能感兴趣的问题

上一篇数据探索引导转换为序数变量下一篇无法学习 Word2Vec 模型的权重