过滤一系列坐标

数据挖掘 机器学习
2022-02-23 23:59:12

假设我收到坐标列表(纬度、经度),每个坐标代表一条 2D 路线。后来我想用这些数据进行路线预测,但首先我有一个初步的问题要解决:我期望这些列表是排序的,虽然每条路线的大部分坐标确实是排序的,但有些不是。例如:

a) 预期:

在此处输入图像描述

b) 实际:

在此处输入图像描述

其中 t 是时间戳。

我正在寻找解决此问题的解决方案,例如删除所有坐标,如 b.t3 或适当地对列表进行排序。有人有什么建议吗?

1个回答

这提出了许多您可能无法回答的问题,这可能没有帮助,但希望它有帮助。

关于数据,它的来源是什么?它是全部以电子方式收集的,还是融合了,比如送货司机日志,这些日志很容易被伪造或记录不正确?换一种方式问,你怎么知道基于时间戳的顺序不正确?

另一方面,如果您知道路线上各点之间的关系,为什么还要考虑时间戳值呢?从您的评论来看,参与者似乎是直线行驶。如果是这种情况,您可以根据坐标知道顺序。您可以按距坐标平均值的距离对它们进行排序。

由于“已知”路线和“记录”路线之间存在一些分歧,我认为要解决数据,您需要了解导致这种分歧的原因?时间戳是由一台设备还是多台设备生成的?如果是一台设备,则可能有人没有驾驶通告的路线。如果有多个设备,可能其中一个设置为错误的时区或只是时间错误。

同样,这不是一个真正的答案,但希望对您有所帮助。