我得到了以下问题作为考试的测试问题,我根本无法理解答案。
投影到前两个主成分上的数据散点图如下所示。我们希望检查数据集中是否存在某种组结构。为此,我们使用欧几里得距离度量运行了 k = 2 的 k-means 算法。根据随机初始条件,k-means 算法的结果在运行之间可能会有所不同。我们多次运行该算法并得到一些不同的聚类结果。
通过对数据运行 k-means 算法,只能获得所示的四个聚类中的三个。k-means不能得到哪一个?(数据没有什么特别的)
正确答案是 D。你们谁能解释一下为什么?