我想通过二面角对蛋白质构象进行聚类。我的观点是一个 n 维向量,其中 n - 二面角的数量。我认为我不能使用欧几里得距离作为距离度量,因为 +179 度和 -179 度之间的距离是 2 度,而不是 358 度。
你能为这些任务推荐一些聚类算法和距离度量吗?也许来自地理点聚类的一些算法。
我想通过二面角对蛋白质构象进行聚类。我的观点是一个 n 维向量,其中 n - 二面角的数量。我认为我不能使用欧几里得距离作为距离度量,因为 +179 度和 -179 度之间的距离是 2 度,而不是 358 度。
你能为这些任务推荐一些聚类算法和距离度量吗?也许来自地理点聚类的一些算法。
你有循环变量。处理它们的一种方法是为每个变量创建两个变量:sin(alpha_1), cos(alpha_1), sin(alpha_2), cos(alpha_2), ... 然后您可以使用常规聚类算法。
存在用于循环数据的自定义算法。示例:多元循环数据的无监督聚类