Sklearn 的文档引用了集群的“平面”或“非平面”几何形状来描述其实现的聚类算法的用例。这些术语没有直接定义。但是,以下引用指出:
当簇具有特定形状(即非平面流形)并且标准欧几里德距离不是正确的度量时,非平面几何聚类很有用。
到目前为止,我确实理解一个流形类型的形状很难用一个聚类中心来表示,并且聚类这样的数据集应该依赖于局部密度、最近邻或连接约束。但是,根据维基百科的定义,我不明白它与平坦度概念的关系:
在几何学中,平面是欧几里得空间的子集,与低维欧几里得空间一致。
这对我来说似乎很矛盾。例如,超球面在几何上不是平坦的,但使用 sklearn 的术语会是平坦的。
我的问题是:
- 平面和非平面几何是机器学习和统计中的合法术语吗?
- 如果是,数学定义是什么?
- 如果不是,最合适的选择是什么?(例如流形与凸形???)