C 如何对支持向量机的偏差和方差产生影响?

数据挖掘 机器学习 支持向量机 方差 偏见 范围
2022-03-06 10:07:59

SVM 的最小化问题可以写成——

θminCi=1m[yicost1(θTxi)+(1yi)cost0(θTxi)]+12j=1nθj2

现在,该如何选择C导致欠拟合或过拟合?

据我了解,选择参数是为了Ci=1m[yicost1(θTxi)+(1yi)cost0(θTxi)]部分0. 我们关注第二部分。

Andrew Ng,一个大的C导致更低的偏差和更高的方差。

这是怎么发生的?这背后的直觉是什么?

1个回答

C 是一个正则化参数,控制你想对给定曲线的每个错误分类点惩罚你的模型的程度。

如果你给 C 赋予很大的价值,它会尝试减少错误,但同时它可能会在测试数据集上表现不佳,从而导致过度拟合。

了解更多关于 C 在 svm 中的作用。参考这个