任何简单的方法来聚类 GPS 轨迹?

机器算法验证 聚类 空间的 地质统计学
2022-03-16 00:47:56

谁能推荐一种简单的方法来聚集数百个 GPS 轨迹以找出它们的共同路径?GPS 数据来自已行驶数千英里的不同车辆。

4个回答

没有简单的方法。

  1. 什么是集群没有普遍有用的公认定义,那么如何进行集群呢?

    相似性不是客观的。如果您使用例如DTW,那么您确实假设整个系列都是相关的,而不仅仅是其中的一部分。适用于技术部分,但这并不意味着结果就是正在寻找的......

  2. 复杂性和成本。特别是如果您对部分重叠感兴趣,成本会急剧上升。分割本身非常困难,需要首先解决。

首先弄清楚你想要什么。不要从方法开始,而是从确切的目标开始:什么是好的结果(以及您将如何使用它,它的影响是什么?)

似乎您只需要估计属于普通路径的“好”位置的空间分布即可检测异常值,这是一个比路径聚类更好的问题。

天真但可能足够的方法是将整个路径束转换为分辨率等于您的预期容差(~100m)的密度栅格,并在车辆绕道到空像素(或低于某个阈值)时使用它来发出警报如果您的数据已经有异常值)。

考虑将问题表述为构成路径的位置图,并且您希望找到经常出现的子图。尝试查看频繁模式挖掘方法,特别是挖掘图、树和结构。

我最初在gSpan 算法中遇到了这个想法它找到子图的层次结构(从小到大),并通过创建要遍历的节点的字典顺序来有效地做到这一点。作者甚至可以使用gSpan 的实现

您可能会遇到基于图形的方法的问题,因为我认为两个纬度/经度不太可能完全相同,您可能需要四舍五入。

有许多不同的形式来解决这个问题。在这个领域有很多研究工作(我猜是从 2000 年开始),并且引入了大量的算法。最近我读了一篇很好的综合调查,我建议你阅读它:“轨迹数据挖掘:概述”,微软研究院的 Yu ZHENG。为了更容易找到答案,您可以直接阅读“序列模式挖掘”、“轨迹的距离/相似性”和“轨迹聚类”部分,考虑到您的问题,这些部分会提供更多信息。