推导 k-means 聚类中均值的更新规则

数据挖掘 机器学习 k-均值 无监督学习
2022-03-13 10:21:41

我有一个作业问题,要求我从失真度量中推导出更新规则: 在此处输入图像描述

然后它说:“更新规则是通过计算第 k 个均值的每个元素的梯度并求解梯度为零的值得出的。” 有人能告诉我这个问题是什么意思吗?我已经了解 k-means 聚类的工作原理,但我需要澄清一下“k-th mean”和“gradient”的含义。

1个回答

第 k 个均值仅表示第 k 个簇的均值。我们希望最小化每个集群的平方和,我们通过最小化这个所谓的失真度量来做到这一点。梯度是导数的多元泛化,当优化时,这个失真度量的梯度是零向量,然后你更新你的集群。