需要帮助理解 Hard SVM 二次规划方程

数据挖掘 机器学习 支持向量机
2022-03-13 02:59:52

这是来自 Shalev-Schwarz p 的教科书“理解机器学习”。169. 在此处输入图像描述

谁能帮我理解为什么这个优化问题的解决方案需要除以 w 的范数?(其他在线资源提到了这种转换为二次规划,但省略了除法部分。)

非常感谢你!!

1个回答

您希望最大化边距,以便每个类的所有点都尽可能地进入它们的半空间。从数学上讲,这意味着您的方程式: 让我们想想这实际上意味着什么。

yi(w,xi+b)>1i

如果将不等式两边除以你得到: ||w||

yi(w||w||,xi+b||w||)>1/||w||i

表达式: 基本上表示每个点到超平面的距离,它由法向量(超平面方向)和(超平面偏差),因为您将投影到单位长度向量上。

w||w||,xi+b||w||
w||w||b||w||Xi

现在,如果您最大化等式的右侧(最小化),由于不等式方向,它也必然会最大化左侧,但是,假设您的表示如上所述被标准化。w

希望这有助于在这里有所启发。