我的任务包括两点:
1)进行数据聚类;
2) 将新数据分配给生成的集群;
我想将集群的边界突出显示为属于集群的观察值的每个坐标的最小值/最大值,然后根据其边界将来自新数据的观察值分配给特定集群。然而,问题是集群边界相交,每个观察可以属于几个集群。在这种情况下,可以使用哪些适当的方法来区分数据?
我的任务包括两点:
1)进行数据聚类;
2) 将新数据分配给生成的集群;
我想将集群的边界突出显示为属于集群的观察值的每个坐标的最小值/最大值,然后根据其边界将来自新数据的观察值分配给特定集群。然而,问题是集群边界相交,每个观察可以属于几个集群。在这种情况下,可以使用哪些适当的方法来区分数据?
如果您对属于集群的点的定义只是最接近集群质心的点,则边界不能重叠。点分配是一个 Voronoi 地图,如:
(来源:https ://www.quora.com/What-is-the-difference-between-K-Means-and-Voronoi/answer/Ethan-Brooks-3 )
最近的质心,因此分配,是明确的。