机器算法验证 - 为什么 K-means 聚类的决策边界是线性的？ - 吾爱随笔录

为什么 K-means 聚类的决策边界是线性的？

机器算法验证聚类 k-均值

2022-03-13 13:52:27

显然，对于 K-means 聚类，数据点是否在聚类中的决策边界 $A$ 或集群 $A'$ 是线性的。

我不太明白这个说法。为什么是线性的？K-means 聚类的每次迭代，我都会将数据点重新分配给聚类以最小化平方误差。然后，我重新分配原型（集群的中心）以再次最小化错误。

这些过程如何创建“线性决策边界”？

2个回答

存在线性和非线性分类问题。在线性问题中，您可以绘制线、平面或超平面（取决于问题中的维数），以便正确分类所有数据点。在非线性问题中，您不能这样做。如您所知，线、平面或超平面称为决策边界。

K-means 聚类产生一个由线性决策边界组成的Voronoi 图。例如，本演示文稿描述了集群、决策边界（幻灯片 34）并简要描述了 Voronoi 图，因此您可以看到相似之处。另一方面，依赖于隐藏层数量的神经网络能够处理非线性决策边界问题。最后，支持向量机原则上能够处理线性问题，因为它们依赖于寻找超平面。但是，使用核技巧，支持向量机可以将非线性问题转换为线性问题（在更高维空间中）

决策边界上的点与中心 C1 和 C2 的距离相等。所以你有了

其它你可能感兴趣的问题

上一篇如何在“星坐标”中绘制 5D 数据集？下一篇方差的无偏估计量还是最大似然估计量？