数据挖掘 - scikit-learn：SVM 中 C 的高/低值 - 吾爱随笔录

数据挖掘 scikit-学习支持向量机

2022-02-26 12:57:30

我正在玩 scikit-learn。查看他们说的用户指南和文档：

低C使决策表面平滑，而高C旨在正确分类所有训练示例。

默认值为 1.0，大多数示例都使用该值。我还发现了值 C=100。

“低”和“高”是什么意思C？

1个回答

SVM 中的损失函数包括分类误差和边际误差。

NowC是一个常数，它附加到分类错误，如下所示：

SVM_Error = C*Classfication Error + Margin Error

因此，高值C意味着分类误差将大于边际误差，因此模型将专注于准确分类所有数据点。相反，如果低值C意味着边际误差将大于分类误差，因此模型将专注于为超平面创建更大的边距

其它你可能感兴趣的问题