支持向量机算法中的最大化边际公式

数据挖掘 机器学习 Python
2022-03-11 12:12:00

我最近在阅读有关支持向量机及其工作原理的文章,偶然发现了一篇文章并遇到了最大化距离边距。

谁能告诉我我们必须在这里最小化什么?我无法理解我粘贴在下面的这部分。什么是wm在下面给出的公式中?

最大化边距

为简单起见,我们将跳过计算保证金的公式 m 的推导,即

m=2w

这个公式中唯一的变量是 w,它与 m 成间接比例,因此为了最大化边距,我们必须最小化 ||w||。这导致以下优化问题:

min(w,b)w22

服从

yi(wx+b)1,i=1,,n

以上是我们的数据是线性可分的情况。很多情况下,数据无法通过线性分离进行完美分类。在这种情况下,支持向量机寻找最大化边距和最小化错误分类的超平面。

文章链接:Hackerearth

1个回答

在此处输入图像描述我们正在寻找的分离超平面是wTx+b=0w是分离超平面的系数或斜率,m是边距。

通过缩放,对于正类,我们希望最近的数据点(支持向量)满足,对于负类,我们希望最近的数据点满足 .wTx+b=1wTx+b=1

回想一下几何课,(这里维情况)点到平面的距离是3ywTx+b=0

|wTy+b|w.

因此,最近点到超平面的距离将是,因此,边距,这是两个类之间最近的距离将是|±1|w=1w2w

我们想要最大化边距,相当于最小化相当于最小化受我们正确分类点的约束。2ww2w22