如何对位于球体上的点进行聚类

数据挖掘 聚类
2022-02-20 03:33:08

我想通过二面角对蛋白质构象进行聚类。我的观点是一个 n 维向量,其中 n - 二面角的数量。我认为我不能使用欧几里得距离作为距离度量,因为 +179 度和 -179 度之间的距离是 2 度,而不是 358 度。

你能为这些任务推荐一些聚类算法和距离度量吗?也许来自地理点聚类的一些算法。

1个回答

你有循环变量。处理它们的一种方法是为每个变量创建两个变量:sin(alpha_1), cos(alpha_1), sin(alpha_2), cos(alpha_2), ... 然后您可以使用常规聚类算法。

存在用于循环数据的自定义算法。示例:多元循环数据的无监督聚类