支持向量机错误

数据挖掘 数据 支持向量机 数据科学模型
2022-03-07 11:32:18

SVM 分类误差、SVM 边际误差和 SVM 总误差有什么区别?他们有什么明确的定义吗?SVM 中的 C 参数是什么?它完全让我困惑!

1个回答

SVM 有 3 个非常重要的组件:支持向量、分离超平面和边距。

支持向量机的组件

  • 当发生错误分类时,这是因为给定点位于分离超平面的错误一侧,这称为 分类错误
  • 每当一个点在边距内时,都算作边距误差
  • SVM的总误差是分类误差和边际误差之和。

现在,要了解 C 参数,您必须知道有两种类型的 SVM:

  • 硬边距:这些尝试在不引入任何错误的情况下最大化边距。
  • 软边距:它们也具有相同的目标,但它们允许发生一些分类和边距错误。允许的错误数由 C 参数(通常称为惩罚参数)控制:如果 C 较小,则 SVM 允许一些错误,因此可以达到更好的泛化;但是随着 C 的增加,SVM 越来越多地惩罚这些错误,最终达到它根本不允许错误的程度。

正如您在左侧看到的那样,一个非常大的 C 通过不允许任何错误来限制模型,当存在异常值时显示非常糟糕的结果。在右边,通过使用一个小的惩罚参数,我们让负离群值位于正区域,因此最大化边际值并达到更尊重的分离超平面。

C值比较

不过,请注意,如果您有一个具有非常大 C 值的软边距 SVM,它的行为将与硬边距 SVM 一样。