scikit-learn:SVM 中 C 的高/低值

数据挖掘 scikit-学习 支持向量机
2022-02-26 12:57:30

我正在玩 scikit-learn。查看他们说的用户指南文档:

C使决策表面平滑,而高C旨在正确分类所有训练示例。

默认值为 1.0,大多数示例都使用该值。我还发现了值 C=100

“低”和“高”是什么意思C

1个回答

SVM 中的损失函数包括分类误差和边际误差。

NowC是一个常数,它附加到分类错误,如下所示:

SVM_Error = C*Classfication Error + Margin Error

因此,高值C意味着分类误差将大于边际误差,因此模型将专注于准确分类所有数据点。相反,如果低值C意味着边际误差将大于分类误差,因此模型将专注于为超平面创建更大的边距