k-means算法中的循环

机器算法验证 聚类 算法 k-均值
2022-03-23 13:31:50

根据维基,最广泛使用的收敛标准是“分配没有改变”。我想知道如果我们使用这样的收敛标准是否会发生循环?如果有人提到一篇文章,该文章给出了骑自行车的例子或证明这是不可能的,我会很高兴。

3个回答

这篇论文似乎证明了在有限数量的步骤中收敛。

均值目标函数随着分配的每次变化而严格减小,这自动意味着收敛而没有循环均值的每个步骤中产生的分区满足“Voronoi 属性”,因为每个点总是被分配到其最近的中心。这意味着可能的分区总数的上限,这会产生均值的终止时间的有限上限。kkk

有限精度下,可能会出现循环。

单精度循环频繁,双精度循环异常。

当接近局部最小值时,目标函数有时可能会由于舍入误差而略有增加。这通常是无害的,因为算法函数再次减小并最终达到局部最小值。但偶尔,该算法会在之前访问过的任务上执行,并开始循环。

在现实世界的停止标准实现中观察循环既简单又安全。