我正在努力预测交叉路口网络上的物理交通量。
我拥有的数据是按交叉点排序的,包括他们经过的时间(以纪元后秒为单位)和某人来自的方向。这里有一个模拟样本(我有几个月的 60 个交叉点的数据):
Intersection 1:{
(1456140051, 1),
(1456140066, 2),
(1456140070, 2),
(1456140073, 3),
(1456140078, 1),
(1456140091, 1)}
Intersection 2:{
(1456140051, 1),
(1456140058, 4),
(1456140060, 3),
(1456140063, 2),
(1456140067, 2),
(1456140071, 4)}
(注意:数据不是完整的网络,有许多较小的交叉口没有收集到数据)
到目前为止,我已经做了一些傅立叶分析,这给了我很强的每周和每日周期性(显然),因此计算了每个交叉点的每日/每周平均值/噪声等,并且我已经寻找了一些相邻交叉点之间的一些相关性。对我来说,下一步是使用来自所有路口的数据来估计一个路口的交通量,然后对未来 10 分钟的交通量做同样的事情。
我发现了各种机器学习方法,它们应该适用于具有恒定时间间隔和不同值的时间序列(例如,每分钟 1 个不同值的数据点),并且我可以聚合我的数据,以便每分钟获得流量值或所以(典型的流量在 5 到 100 次/分钟/交叉路口之间)。但是,我觉得那样我会丢失很多信息。
因此,我正在寻找一种可以将我拥有的数据(或该数据的某些派生数据,而不会丢失太多信息)作为输入的方法。任何人都可以推荐一些文章或指出我正确的方向吗?