假设我有一个带有点的数据集和相异性度量每对之间,以及一个重量这证明了这种差异的质量。我有两个问题:
第一个是在进行谱聚类时如何引入权重。就像在 Shi-Malik、Ng-Jordan-Weiss 版本中一样,仅使用距离。
第二个是我的差异度量有时不存在。在这些情况下,它的权重为零。如何在算法中引入这些案例?如果我知道如何介绍它们,我想零权重可以解决问题。
我的一个想法是将相似转换执行为:
但我觉得这没有意义,因为重量应该反映度量的重要性,而不是度量本身。
数据不是欧几里得,所以我只能使用这种差异度量。任何参考表示赞赏。