在一篇学术论文中,他们谈到了使用最近邻算法来预测新点的聚类。以及在他们的示例中如何将最近邻居的数量设置为 10。他们是什么意思?我能想到的两件事是:
查看训练集(邻居)中使用的哪 10 个点最接近,然后将其分配给大多数点来自的集群。
从训练集中一个一个地收集最近的点,直到你有 10 个点来自一个集群。那就是该点所属的集群。
将(n)(现有)集群分配给新点的其他方法是什么?
在一篇学术论文中,他们谈到了使用最近邻算法来预测新点的聚类。以及在他们的示例中如何将最近邻居的数量设置为 10。他们是什么意思?我能想到的两件事是:
查看训练集(邻居)中使用的哪 10 个点最接近,然后将其分配给大多数点来自的集群。
从训练集中一个一个地收集最近的点,直到你有 10 个点来自一个集群。那就是该点所属的集群。
将(n)(现有)集群分配给新点的其他方法是什么?
如果论文没有详细说明这一点,那一定意味着他们做了 1)。他们寻找一个新点的 10 个最近邻,并使用多数投票来分配一个集群。在旁注中,奇怪的是他们使用偶数个邻居,因为它可能会引入联系。
“将(n)(现有)集群分配给新点的其他方法是什么?”
方法有很多,但不代表都好!您可以将点随机分配给集群并使用集群的大小作为权重,但这不是一个很好的方法。
通常,使用最近邻方法。现在,它可以通过多种方式完成: