铰链损失函数的定义是什么?

人工智能 神经网络 定义 支持向量机 二元分类 铰链损失
2021-11-02 06:21:52

我遇到了用于训练神经网络模型的铰链损失函数,但我不知道它的分析形式。

我可以将均方误差损失函数(更常用于回归)写为

i=1N(yiyi^)2

在哪里yi是数据集中的期望输出,yi^是模型的实际输出,并且N是我们数据集中的实例总数。

同样,铰链损失函数的(基本)表达式是什么?

1个回答

铰链损失/误差函数是在支持向量机的上下文中用于二分类(但也可以扩展到多类分类)的典型损失函数,尽管它也可以在神经网络的上下文中使用,如这里描述

铰链损失函数定义如下

(1)(y)=max(0,1ty),
在哪里

  • t={1,1}是标签(因此,如果您的标签在集合中{0,1},您必须先将它们映射到{1,1})
  • y是分类器的输出(例如在线性 SVM 的上下文中,y=wx+b, 在哪里wb是超平面的参数)

这意味着方程中的损失1总是非负的。如果您熟悉ReLU,那么您应该对这种损失很熟悉。事实上,他们的情节非常相似。

有关更多详细信息,您可能应该从相关的 Wikipedia 文章开始,然后可能是涵盖支持向量机的众多机器学习书籍之一,例如Christopher Bishop 的Pattern Recognition and Machine Learning (2006),第 7 章(第 325 页) .