是否有用于网络的机器学习模型?

数据挖掘 机器学习 神经网络 贝叶斯网络
2021-10-03 15:56:55

我正在研究一个回归问题,其目标是估计整个交通网络的历史交通量。我在 100 个位置有交通计数器,因此模型可以学习交通量与许多解释变量(例如,速度、道路特征、天气)之间的关系。之后,我可以应用该模型来估计我没有交通计数器的地方的历史交通量。

我的神经网络工作得相当好,但我想知道是否有机器学习模型可以明确解释我的道路网络的拓扑结构以及相邻道路连接上的交通高度相关的事实。我可以将“最近流量计数器的流量”作为输入变量添加到我的 ANN,但我想知道是否有更智能的方法。

在这方面,我遇到了贝​​叶斯网络,它可以解释网络拓扑和相关性。但是,它们似乎适用于我们在 100 个位置有传感器并且我们想要预测未来时间点的交通状态(在这 100 个位置)的情况。另一方面,我在 100 个位置进行了测量,并希望估算同一时间点不同位置的流量。

任何建议都非常感谢!

2个回答

来自测量和预测网络安全的相关领域,我强烈建议尝试时间序列预测。我假设您的数据是基于时间戳的(网络拥塞值,以某个间隔采样?如果不跳到第二个想法)

第一个想法: 我会从时间序列中借用将 100 个测量值扁平化为 1 个数据的概念。所以而不是:

[t1+delta1,位置1,messurement1]

[t1+delta2,位置2,messurement2]

[t1+delta3,位置3,messurement3]

折叠成:

[t1-bucketed,loc1,mess1,loc2,mess2,loc3,mess3。]

这将有助于模型“掌握”不同测量值之间的关系,重点是时间轴

第二个想法 将每个测量行中按拓扑(甚至整个 100 个邻居)最接近的测量结果展平为:

[混乱,topol-1-混乱,topol-1-dist,topol-1-其他,topol-2-混乱,topol-2-dist,topol-2-其他,..]

这将有助于模型“掌握”特定测量与其邻域测量之间的关系,重点是每个测量的拓扑特征

请让我们知道这是否有帮助:)

一种简单的方法是使用k-nearest-neighbors,在您的情况下,距离度量是“距离的道路连接数”。该技术在The Elements of Statistical Learning 的第 2 章和第 13 章中进行了描述基本上,它将取k最近交通节点的平均交通量。除了交叉验证和调整以找到最佳值之外,基本上不涉及任何培训k权衡是查询时计算量很大(当您想要进行预测时)。

旁注:如果您还没有,我强烈建议您使用Neo4j之类的数据库,以便更轻松地查询链接距离。如果您使用图形数据库,您可能只需要 3-4 行代码就可以自己编写 KNN“模型”。