计算科学 - 与函数的凸性和凹性有关的混淆 - 吾爱随笔录

我正在阅读这篇论文http://www.ist.temple.edu/~vucetic/documents/wang11kdd.pdf与用于非线性分类的自适应多超平面机有关

在那篇论文中，他们提到了多类 SVM，每个类都有多个权重。

任何分类的损失是

$l(x_n,y_n) = max_{i\epsilon y\\\y_n}(0,1 + max g(i,x_n) - g(y_n,x_n))$

在哪里 $y_n$ 是第 n 个示例的标签，并且 $x_n$ 是特点。

当他们训练这个算法时，我有这种困惑。他们称之为 SVM MM（多超平面）。

他们说凸近似问题被定义为

$min_{W}P(W|z) = \frac{\lambda}{2}||W||^2 + \frac{1}{N}\sum_{n=1}^{N}l_{cvx}(W;(x_n,y_n);z_n)$

他们有凹项的地方 $-g(y_n,z_n)$ 替换为凸项 $-w^T_{y_n,z_n}x_n$ .

我不确定我是否已经清楚地描述了它。但我也会附上论文的截图。问题是我不明白这有什么区别 $-g(y_n,z_n)$ 和 $-w^T_{y_n,z_n}x_n$ . 在我看来，它们是同一个词。

我可能会问很多。但是谁能提供一些信息？

在此处输入图像描述

我用红色矩形标记了我不明白的部分。我可能会问很多。但我没有得到那部分。为什么会这样？