如何创建位置数据集群?

数据挖掘 r 聚类
2021-10-09 15:34:49

我问这个问题是因为一个问题不是很有帮助,我询问了针对同一问题的不同解决方案。

问题

随着时间的推移,我有车辆的横向位置 ,xcoord它们被记录为与道路右边缘的距离。在下图中可以看到一辆车:

在此处输入图像描述

图上的每个点代表车辆前部中心的位置。当车辆改变车道时(车道编号未显示),位置会发生剧烈变化,如图中“开始车道改变”之后所示。
该图背后的数据如下:

  Vehicle.ID Frame.ID   xcoord Lane
1          2       13 16.46700    2
2          2       14 16.44669    2
3          2       15 16.42600    2
4          2       16 16.40540    2
5          2       17 16.38486    2
6          2       18 16.36433    2

我想通过对图中所示的数据进行聚类来识别变道的开始和结束数据点。图中红色圈出的数据点彼此更相似,因为与中间位置变化较大的数据点相比,它们之间的变化较小 ( xcoord)。
我的问题是:是否可以应用任何聚类技术来分割这些数据,以便我可以识别变道的起点和终点?如果是,哪种技术最适合?
我使用 R。我之前尝试过分层聚类,但不知道如何在这种情况下应用它。请帮忙。

1个回答

我怀疑任何聚类算法都能很好地工作。

相反,您应该调查:

  • 分割(是的,这是不同的东西),特别是时间序列分割
  • 变化检测(正如你所说,首先有一个相当恒定的分布,然后是一个变化,然后又是一个相当恒定的分布
  • 分段回归也可能起作用:尝试找到恒定、线性变化和再次恒定的最佳拟合。在这个受限模型中,本质上需要优化四个参数:前后平均 + 过渡开始和结束。