为什么 SVM 成本函数是超平面参数的范数,而不是均方误差?
数据挖掘
支持向量机
2022-02-22 13:40:29
1个回答
给定一个线性可分的数据集,SVM 算法背后的直觉是找到一个将两个类分开并最大化边距 (超平面到最近数据点的距离的两倍)的超平面。
因此,从分离这两个类的所有超平面中,我们希望找到具有最大边距的超平面(以实现最佳泛化)。
假设我们有两个由向量定义的平行分离超平面,并且它们之间没有数据点,它们的距离由下式给出: 为了最大化这个距离,两个超平面必须通过对立类的数据点。在这种情况下,我们可以在中间定义另一个超平面(与两个超平面具有相同的距离和相同的向量),现在具有边距。
从公式中可以看出:较小的越大。
所以最大化边距等价于最小化. 因此,分离超平面是最优的,如果它最小化.
这只是粗略的直觉 - 如果你想更深入地了解它背后的数学,我可以推荐:http ://www.svm-tutorial.com/2015/06/svm-understanding-math-part-3/
其它你可能感兴趣的问题