有哪些选项可以组合不同的距离函数?

机器算法验证 距离函数
2022-04-16 13:34:54

我目前正在使用由连续属性组成的特征向量,因此我可以将欧几里德距离用于 KNN 分类和聚类等事情。现在我想添加一个定义了特殊距离函数的名义属性。我有哪些组合这些距离函数的选择,所以我仍然可以获得两个向量的一个距离?

1个回答

我能想到三个:

  1. 以线性方式组合它们(d=d1+αd2) 并找到最好的α通过一些优化,假设最小化 kNN 的 CV 误差或最小化聚类的轮廓。
  2. 根据两个距离训练单独的分类器/对数据进行几次聚类,然后混合结果。这可能效果不太好,因为您只有 2 个基本方法。
  3. 仅用于分类,您可以使用“klNN”——getk基于第一个度量的邻居和l基于第二个。