在基于图的聚类中,为什么更喜欢使用高斯核而不是两点之间的距离作为相似度度量?
为什么我们使用高斯核作为相似度度量?
数据挖掘
机器学习
数据挖掘
聚类
公制
2021-09-30 08:48:15
3个回答
从欧几里得距离,您可以从核函数(多项式、指数、Matern、自定义...)中推导出许多相似性度量,其中没有一个比高斯核更好或更差。这完全取决于您的数据和您的期望。
给定一个核函数,您还可以选择任何适合您感觉的距离定义:加权欧几里得距离, 规范, 规范,推土机的距离...
现在,具有欧几里得距离的高斯核非常常见,因为它非常直观,并提供了有用的属性,例如平滑度。
在欧几里得空间中,轴由向量,三维空间,距离可以通过连接两点并找到连接的长度来获得。只要每个方向的基础是独立的,就会使用这个空间。换句话说,每当需要找到真实距离时,如果特征或变量、轴确实是独立的,则可以使用欧几里得距离。相反,只要变量相关,就不能使用欧几里得距离,因为轴不再是独立的。在这种并不罕见的情况下,可以使用Mahalanobis 。它的形式类似于高斯距离。