对只有时间戳的数据进行机器学习

数据挖掘 机器学习 时间序列
2022-02-27 10:31:35

我正在努力预测交叉路口网络上的物理交通量。

我拥有的数据是按交叉点排序的,包括他们经过的时间(以纪元后秒为单位)和某人来自的方向。这里有一个模拟样本(我有几个月的 60 个交叉点的数据):

   Intersection 1:{
     (1456140051, 1),
     (1456140066, 2),
     (1456140070, 2),
     (1456140073, 3),
     (1456140078, 1),
     (1456140091, 1)}
   Intersection 2:{
     (1456140051, 1),
     (1456140058, 4),
     (1456140060, 3),
     (1456140063, 2),
     (1456140067, 2),
     (1456140071, 4)}

(注意:数据不是完整的网络,有许多较小的交叉口没有收集到数据)

到目前为止,我已经做了一些傅立叶分析,这给了我很强的每周和每日周期性(显然),因此计算了每个交叉点的每日/每周平均值/噪声等,并且我已经寻找了一些相邻交叉点之间的一些相关性。对我来说,下一步是使用来自所有路口的数据来估计一个路口的交通量,然后对未来 10 分钟的交通量做同样的事情。

我发现了各种机器学习方法,它们应该适用于具有恒定时间间隔和不同值的时间序列(例如,每分钟 1 个不同值的数据点),并且我可以聚合我的数据,以便每分钟获得流量值或所以(典型的流量在 5 到 100 次/分钟/交叉路口之间)。但是,我觉得那样我会丢失很多信息。

因此,我正在寻找一种可以将我拥有的数据(或该数据的某些派生数据,而不会丢失太多信息)作为输入的方法。任何人都可以推荐一些文章或指出我正确的方向吗?

0个回答
没有发现任何回复~