使用 C=0 和 C=infinity 的 SVM 分类器,对这些数据进行分类会有什么影响?
数据挖掘
机器学习
支持向量机
2022-02-19 07:57:20
1个回答
C 值类似于 lambda,L2/L1 正则化超参数,但方式相反。每当 C 很大时,意味着您的模型很可能会过度拟合手头的数据。只要它很小,您的模型就会忍受一些错误,以避免产生较小的边距,因此您将拥有一个不太容易过度拟合的模型。第一个称为硬 SVM,后一个称为软 SVM。在您的情况下,我想没有区别,因为您的模型是线性可分的。如果X4介于X2和X3之间,那么每个硬和软的结果都会不同。在数据不是线性可分的情况下,软硬和硬是不同的,或者它们可能是可分的,但如果 SVM 丢弃一些样本,边距会变窄或变宽。柔软的试图通过丢弃那些阻碍较大边距被装箱的少数数据来使分隔空间,边距尽可能大,但努力将数据分开以尽可能减少错误。在你的情况下,你会得到相同的结果。
为了说明更多,请看左图。它试图丢弃阻碍创建大边距但大边距的样本,考虑所有样本。
其它你可能感兴趣的问题

