聚类中心和均值之间的差异

数据挖掘 k-均值
2022-01-28 21:42:25

以下是我从集群模型中得到的集群中心的输出(kmeans - 6 个集群)

3.371069、3.920354、3.629747、3.700000、3.988506、3.740385

然而,在将数据分割成 6 个集群并取 6 个集群中每个集群的数据平均值后,我得到了一组与上述不同的数字。

3.7、3.6、3.6、3.8、4.2、3.3

我的问题是集群中心与平均值不同吗?

为什么我得到不同的值?

1个回答

他们是一样的。

当你运行 K-Means 时,集群中心每次迭代都会改变。在每次迭代中,都会为该特定集群给出集群中心或平均值。在下一次迭代中,可能会形成一个新的集群。聚类中心需要重新计算。

当算法收敛时,您将获得所形成集群的绝对均值。对于大多数意图和目的,它们是相同的。