关于双曲正切核的性质

数据挖掘 机器学习 支持向量机 监督学习 参考请求
2022-02-28 19:26:57

双曲正切内核如何工作?他们背后的直觉是什么?你能提供证明和例子来说明吗?

双曲正切核定义为:

K(x,x)=tanh(α(xx)+c)

例如,对于高斯 RBF 核,直觉是支持向量根据影响的局部性影响决策面。双曲正切(Sigmoid Kernels)的类比是什么?

双曲正切内核的一些参考资料是:

  1. 宣天林和林志仁
  2. Sabri Boughorbel, 让-菲利普·塔雷尔, Nozha Boujemaa
1个回答

Sigmoid 内核的流行归功于传统上使用 sigmoid 激活函数的神经网络。Sigmoid 内核不再强调极端相关性。在某种程度上,它们的行为有点像相关系数,它也有一个有限的范围,强调方向的相似性。c移动 sigmoid 上的操作点,影响输入之间角度的相对强调。也许这种可视化(对于c=0) 可能有助于在脑海中想象这一点:

用于临床数据分类的新 Mercer Sigmoid 内核

您的第一个参考资料指出,对于某些参数,sigmoid 内核的行为类似于 RBF。这使得它们适合非线性分类。您可能知道 sigmoid 内核只是有条件的 PSD,因此有时不对应于Mercer 定理的任何隐式特征图的内核函数。


对内核方法感兴趣的人应该有一本Learning with Kernels