K-means 作为 Soft K-means 算法的极限

机器算法验证 自习 聚类 k-均值
2022-03-16 13:59:40

我遇到了以下练习

证明当刚度变为时,软均值算法变得与原始硬均值算法相同,除了没有指定点的均值的行为方式。描述这些手段做什么而不是坐着不动。βKK

符号如下:

通过责任 r_kx(n)k

rk(n)=exp(βd(m(k),x(n)))iexp(βd(m(i),x(n)))

其中是第个聚类点,然后的更新完成m(k)kd(x,y)=12i(xiyi)2m(k)

m(k)=irk(i)x(i)irk(i)

随着刚度变为,我看到软均值变为硬均值。βKK

问题的第二部分是询问在硬均值的上下文中没有分配点的均值,因此不会移动。然而,使用软意味着它们会移动,但有谁知道它们在几何上做了什么?KK

2个回答

当我看到我们有一个单点和两个集群的情况时,在我看来,软 k-means 中的两个集群最终都会以单点为中心。

在软 k-means 中,没有所谓的“未分配”集群,因此在硬 k-means 中未分配的每个集群都将以最近的点为中心。

尝试为每个找到概率解释。然后尝试将新位置表示为对 r 的期望。r