在 SVM 的上下文中,C 和 lambda 有什么区别?

数据挖掘 机器学习 支持向量机
2021-09-16 05:16:37

我不明白参数之间的区别CλSVM而言。在我看来,它们都参与了调节数据的过度拟合。

有什么区别Cλ?

1个回答

你感到困惑是对的。发生的事情是超参数指的是不同的公式。一方面,有一个通用的经验风险最小化器

λw2+1ni=1nmax(0,1yi(xiTw+w0))

另一方面是软利润目标

12w2+C一世=1nξ一世

这样

ξ一世0,是的一世(X一世w+w0)1-ξ一世,一世

第一个将 SVM 置于经验风险最小化的框架中,其中目标是预期损失加上 大号p- 主要参数的规范。在第二个公式中引入松弛变量和约束的目的是允许一小部分点(可通过C) 位于边缘的错误一侧,并消除不可微分最大限度功能。此外,它提请注意支持向量机在损失函数中编码稀疏性,而不是先验。这称为原始形式,可以使用二次规划来解决。维基百科目前在计算分类器部分对此进行了解释。你应该可以看到C=1/2nλ. 有些文本省略了1/2或者n.