我对 k-means 聚类算法做了一些研究。似乎唯一不确定的部分是质心 - 初始化。
假设我有 10k 个数据点和给定的 k. 然后我在每次尝试中随机初始化初始质心:
Try_1:初始 k 质心随机使用 seed_1。然后不断更新质心直到收敛(假设我们可以多次使用 10k 个数据点)
Try_2:使用 seed_2 随机初始 k 质心。然后不断更新质心直到收敛(假设我们可以多次使用 10k 个数据点)
Try_3:使用 seed_3 随机初始 k 质心。然后不断更新质心直到收敛(假设我们可以多次使用 10k 个数据点)
Try_4:使用 seed_4 随机初始 k 质心。然后不断更新质心直到收敛(假设我们可以多次使用 10k 个数据点)
Try_5:使用 seed_5 随机初始 k 质心。然后不断更新质心直到收敛(假设我们可以多次使用 10k 个数据点)
在这 5 次尝试中,最终的聚类结果会相同吗?