SVM:为什么非支持向量的 alpha 为零,为什么大多数向量的 alpha 为零?

机器算法验证 支持向量机 监督学习 拉格朗日乘数
2022-03-28 14:29:07

在 SVM 计算边际的优化问题中,我们使用拉格朗日乘子来插入约束: 现在我们要计算据说为 0。这个陈述是如何从上述等式推导出来的?那怎么证明呢?

L(w,b,α)=1λ|w|α(yi(wxi+b)1)

αα

更新
如果我们使用 KKT 条件求解 SVM 的对偶,我们有: 使用的主要目标之一对偶,是可以更有效地计算,因为上面的方程和事实,大多数,因此我们只需要关注,这是一小部分。

wi=1λΣi=1Nαiyixi
wi[N]αi=0{xi,yi:αi0}

我的问题是:为什么大多数 = 0?αi,i[N]

在几何上,据说正好位于超平面上的数据点。我不确定这是不是真的。如果是这样,那如何证明呢?αi0{x:wTxb=1}{x:wTxb=1}

3个回答

我找到了我的问题的答案,可以很好地解释几何。
我们知道 KKT 条件的互补条件是: 因此,在一个 KKT 点中,至少会发生以下一种情况:

α0,α(yi(wTxi+b)1)=0

情况 1: 情况 2:αi=0
yi(wTxi+b)1=0

此外,我们知道 SVM 边缘的超平面具有以下方程:

  1. H1={x:wTx+b=1}
  2. H1={x:wTx+b=1}

使用边距创建以下半空间:

  1. H1+={x:wTx+b>1}
  2. H1={x:wTx+b<1}

因此,对于任何被正确分类并且确实位于正确半空间内部的 因此,对于这些点“案例 2”被违反,因此“案例 1”,即xi:yi=1xi:yi=1

yi(wTxi+b)1>0
αi=0必须为真,这意味着αi=0对于所有正确分类并位于其半空间内部的点。
因此,αi只能不等于0,如果“案例2”为真,即yi(wTxi+b)1=0. 这对xH1或者xH1这是位于边缘超平面上的点。而这一点是有限的。

因此,对于大多数点αi=0,除了位于边缘的点是有限的。

支持实际上是一个向量,其α非零。这是一个定义,从这里的等式没有什​​么可以证明的。

支持向量可以定义为位于正或负超平面上的那些向量,即那些yi(wTxi+b)1=0. 对于非支持向量,yi(wTxi+b)1非零。

拉格朗日乘数的对偶形式由下式给出:

Lp=minw,bmaxα0(12||(w)||2iαi(yi(wTxi+b)1))

因此,对于非支持向量,αi=0,否则内部优化将“炸毁”