我正在开发一些软件,它应该从几个基于 GPS 的报告中确定真实世界的位置(fe 速度凸轮)。用户在报告位置时会开车,因此报告非常不准确。为了解决这个问题,我必须对同一位置的报告进行聚类并计算平均值。
我的问题是关于如何对这些报告进行聚类。我阅读了有关期望最大化算法和k-means 聚类的信息,但据我所知,我需要提前确定实际位置的数量。
是否有任何其他算法不需要实际位置的确切数量,而是使用一些边缘条件(fe 最小距离)?
报告包含经度、纬度和准确度(以米为单位)。没有名称或其他任何东西可用于识别重复项。
另一个障碍可能是它很常见,即只有一个真实世界位置的报告。这使得很难将异常值与良好数据区分开来。