如果一个数据集只能被多个超平面分开,它是否被认为是线性可分的?

数据挖掘 机器学习 分类 数据集 线性可分
2022-02-17 18:34:38

例如,在线性可分性维基百科文章中,给出了以下示例:

具有两个线性决策边界的数据集

他们说“下面的例子需要两条直线,因此不是线性可分的”。

另一方面,在 Bishop 的“模式识别和机器学习”一书中,他说“可以被线性决策面精确分离的数据集被称为线性可分的”。

根据 Bishop 对线性可分性的定义,我认为 Wikipedia 示例将是线性可分的,即使这篇 Wikipedia 文章的作者另有说明。这是因为 Bishop 说我们可以使用多个线性决策面(超平面)来分离类,它仍然被认为是线性可分离的数据。Bishop 通过提到线性决策面(复数而不是单数)来暗示这一点。

从逻辑上讲,我同意毕晓普的观点。毕竟,维基百科示例中的类是由线性决策面分隔的。那么如何转身说数据集不是线性可分的呢?决策面个类,也许您可​​以强制执行数据集只能线性可分的规则。但是为什么要以这种方式定义线性可分性呢?NN1

那么,维基百科的例子是线性可分的吗?

1个回答

简单来说:线性可分=线性分类器可以完成这项工作。您可以拟合一条直线来正确分类您的数据。

从技术上讲,任何问题都可以分解为许多小的线性决策面;即,您近似具有大量小线性边界的非线性函数。顺便说一句,这就是神经网络对 ReLU 激活所做的事情,但没有人会说神经网络是线性模型。