默瑟定理是否反过来工作?

机器算法验证 内核技巧 距离 相似之处 rbf内核
2022-03-11 08:58:23

一个同事有一个函数,对我们来说它是一个黑盒。该函数测量两个对象的相似度ss(a,b)

我们确定具有以下属性:s

  1. 相似度分数是介于 0 和 1 之间的实数,包括 0 和 1。
  2. 只有自我相同的对象得分为 1。因此意味着,反之亦然。s(a,b)=1a=b
  3. 我们保证s(a,b)=s(b,a)

现在他想使用需要距离作为输入的算法,并且依赖于满足距离公理的输入。

我的想法是,我们可以将相似度分数视为具有一定距离(可能是欧几里得范数或其他距离)的 RBF 内核的结果,即我们可以用代数重新排列并假设相似度分数是指某些(未知)坐标系中一对点的 RBF 内核。

s(xi,xj)=exp(d(mi,mj)2r)rlogs(xi,xj)=d(mi,mj)

其中是某个未知向量,是感兴趣的对象,是某个距离。mαRnxαd

就尊重距离公理而言,显而易见的属性是可行的。结果必须是非负的,并且相同对象的距离仅为 0。但是,这组相当普遍的情况是否足以暗示三角不等式得到尊重并不明显。

另一方面,这听起来有点疯狂。

所以我的问题是“是否存在一个使得对于一些距离度量给定上的这些属性,那是什么ff(s(a,b))=d(a,b)dsf

如果上的这些一般情况下不存在存在的额外要求集fsf

2个回答

默瑟定理是否反过来工作?

并非在所有情况下。

维基百科:“在数学,特别是泛函分析中,Mercer 定理是平方上对称正定函数表示为乘积函数的收敛序列之和。这个定理,在 (Mercer 1909) 中提出,是James Mercer 工作的最显着成果。它是积分方程理论中的一个重要理论工具;它被用于随机过程的希尔伯特空间理论,例如 Karhunen-Loève 定理;它也用于表征一个对称的半正定核。

它是希尔伯特空间上的“多对一映射-粗略的过度简化是将其描述为哈希或校验和,您可以对文件进行测试以确定身份与否。

更多技术解释:崩解定理

“在数学中,分解定理是测度论和概率论的一个结果。它严格定义了测度对所讨论测度空间的测度零子集的非平凡“限制”的概念。它与条件概率测度的存在。从某种意义上说,“分解”是与构建产品测度相反的过程。

另请参阅:Nathan Srebro 的“ The Fubini-Tonelli theorem ”、“ Hinge Loss ”、“ Loss Function ”和“ How Good Is a Kernel When Used as a Similarity Measure? ”(2007 年 6 月),摘要:

"摘要。最近,Balcan 和 Blum 提出了一种基于一般相似函数的学习理论,而不是半正定核。我们研究了基于核学习的学习保证与可以通过使用核作为相似函数,由 Balcan 和 Blum 开放。我们对核函数用作相似函数时的好坏提供了显着改进的界限,并将结果扩展到更实际相关的铰链损失而不是然后是零一错误率。此外,我们证明这个界限是紧密的,因此确定在传统的基于内核的边距概念和新的基于相似性的概念之间实际上存在真正的差距。

一个同事有一个函数,对我们来说它是一个黑盒。s

请参阅:内核和相似性(在 R 中)

它是一个黑匣子,因此您不确定使用的是哪个内核,是否基于内核,并且一旦您认为知道它是哪个内核,您就不知道内核实现的细节。参见:kernlab 中的 rbfKernel 方程与标准不同?.

另一方面,这听起来有点疯狂。

在有限的情况下,它是快速有效的。就像一把锤子,如果你随身携带一把锤子,人们会说你疯了吗?

"核方法的名字来源于使用核函数,这使它们能够在高维、隐式特征空间中操作,而无需计算该空间中数据的坐标,而是通过简单地计算图像之间的内积特征空间中的所有数据对。这种操作在计算上通常比坐标的显式计算便宜。这种方法被称为“内核技巧”。内核函数已被引入序列数据、图形、文本、图像,如以及向量。 ”。

教训:你(有时)得到你付出的代价。

所以我的问题是“是否存在一个使得对于一些距离度量给定上的这些属性,那是什么ff(s(a,b))=d(a,b)dsf

许多,请参阅上面的链接,“流行的核函数”,RBF,这里有一个(昂贵的)示例:“时间序列傅里叶变换之间相似性的似然比距离度量”(2005 年),作者 Janacek、Bagnall 和 Powell。

如果上的这些一般情况下不存在存在的额外要求集fsf

不同的空间和方法可以更好地针对特定问题进行比较(和分解),仅希尔伯特空间就有很多方法

是的,这个列表很大,请参阅上面的链接和(例如):再现内核希尔伯特空间

但是,这组相当普遍的情况是否足以暗示三角不等式得到尊重并不明显。

事实上,这还不够。让我们使用如果有三个点x, y , , , and,则三角不等式失败,因为d(a,b)=1s(a,b)x,y,zd(x,y)=13d(y,z)=13d(x,z)=1d(x,z)>d(x,y)+d(y,z)