在 SVM 计算边际的优化问题中,我们使用拉格朗日乘子来插入约束:
现在我们要计算。据说为 0。这个陈述是如何从上述等式推导出来的?那怎么证明呢?
更新:
如果我们使用 KKT 条件求解 SVM 的对偶,我们有:
使用的主要目标之一对偶,是可以更有效地计算,因为上面的方程和事实,大多数,,因此我们只需要关注,这是一小部分。
我的问题是:为什么大多数 = 0?
在几何上,据说正好位于超平面或上的数据点。我不确定这是不是真的。如果是这样,那如何证明呢?
在 SVM 计算边际的优化问题中,我们使用拉格朗日乘子来插入约束:
现在我们要计算。据说为 0。这个陈述是如何从上述等式推导出来的?那怎么证明呢?
更新:
如果我们使用 KKT 条件求解 SVM 的对偶,我们有:
使用的主要目标之一对偶,是可以更有效地计算,因为上面的方程和事实,大多数,,因此我们只需要关注,这是一小部分。
我的问题是:为什么大多数 = 0?
在几何上,据说正好位于超平面或上的数据点。我不确定这是不是真的。如果是这样,那如何证明呢?
我找到了我的问题的答案,可以很好地解释几何。
我们知道 KKT 条件的互补条件是:
因此,在一个 KKT 点中,至少会发生以下一种情况:
情况 1:
情况 2:
此外,我们知道 SVM 边缘的超平面具有以下方程:
使用边距创建以下半空间:
因此,对于任何被正确分类并且确实位于正确半空间内部的
和因此,对于这些点“案例 2”被违反,因此“案例 1”,即
因此,只能不等于,如果“案例2”为真,即. 这对或者这是位于边缘超平面上的点。而这一点是有限的。
因此,对于大多数点,除了位于边缘的点是有限的。
支持实际上是一个向量,其非零。这是一个定义,从这里的等式没有什么可以证明的。
支持向量可以定义为位于正或负超平面上的那些向量,即那些. 对于非支持向量,非零。
拉格朗日乘数的对偶形式由下式给出:
因此,对于非支持向量,,否则内部优化将“炸毁”