如何使用谱聚类进行预测?

数据挖掘 分类 聚类 预言 谱聚类
2022-03-16 11:37:47

在一篇学术论文,他们谈到了使用最近邻算法来预测新点的聚类。以及在他们的示例中如何将最近邻居的数量设置为 10。他们是什么意思?我能想到的两件事是:

  1. 查看训练集(邻居)中使用的哪 10 个点最接近,然后将其分配给大多数点来自的集群。

  2. 从训练集中一个一个地收集最近的点,直到你有 10 个点来自一个集群。那就是该点所属的集群。

将(n)(现有)集群分配给新点的其他方法是什么?

1个回答

如果论文没有详细说明这一点,那一定意味着他们做了 1)。他们寻找一个新点的 10 个最近邻,并使用多数投票来分配一个集群。在旁注中,奇怪的是他们使用偶数个邻居,因为它可能会引入联系。

“将(n)(现有)集群分配给新点的其他方法是什么?”

方法有很多,但不代表都好!您可以将点随机分配给集群并使用集群的大小作为权重,但这不是一个很好的方法。

通常,使用最近邻方法。现在,它可以通过多种方式完成:

  • 我之前解释过的 KNN(任意数量的 K)
  • 计算每个簇的平均点,并分配到最近的簇
  • 对于每个集群,计算距离新点最远的点,然后分配具有“最远”远点的集群
  • 等等。