基于移动应用的停车预测

数据挖掘 机器学习 Python r 预测建模
2021-10-12 20:29:52

我对预测建模很陌生,但了解 GIS、R、python、SQL 等。

我目前正在做一个项目,试图根据从手机应用程序接收到的数据来预测停车位何时可用。

我有 2 个 sql 表

停车票

  • ParkingTicketId(整数)
  • ParkingAreaId(整数)
  • 纬度(整数)
  • 经度(整数)
  • 位置(文字)
  • 停车日期(日期时间)
  • DurationInMinutes(整数)
  • 到期日(日期时间)
  • 日(文字)

停车区

  • ParkingAreaId(整数)
  • 最大空间(整数)

主要假设是只有应用程序用户可以在 18 个停车场(街上和街外停车场(没有多商店或地下))停车。我没有考虑用户偏好、天气、事件等。这纯粹是基于手头数据的存在和不存在。我研究过技术并正在研究使用出生/死亡模型,但很难找到使用中的示例。

任何有关使用模型的帮助或指示都会很棒!

这是停车场的图片:

样本数据:

 ParkingTicketId    ParkingAreaId   Latitude    Longitude   Date    DurationInMinutes   ExpiryDate  Day
60465   302 42.56246869 -70.91313754    2014/03/07 16:36    5   2014/03/07 16:41    Friday
60466   302 42.57139883 -70.91906364    2014/03/07 16:36    23  2014/03/07 16:59    Friday
60467   302 42.54419925 -70.9417496 2014/03/07 16:36    24  2014/03/07 17:00    Friday
60472   302 42.57576595 -70.92876607    2014/03/07 16:36    16  2014/03/07 16:52    Friday
60477   302 42.55573294 -70.92912634    2014/03/07 16:36    9   2014/03/07 16:45    Friday
60479   302 42.55711998 -70.91200458    2014/03/07 16:36    19  2014/03/07 16:55    Friday
60480   302 42.58008043 -70.91559081    2014/03/07 16:37    5   2014/03/07 16:42    Friday
60485   302 42.55161223 -70.9240808 2014/03/07 16:37    21  2014/03/07 16:58    Friday
60492   302 42.58437849 -70.92764527    2014/03/07 16:37    6   2014/03/07 16:43    Friday

ParkingAreaId   MaxSpaces
302 8
304 50
306 95
308 30
1个回答

如果这些数据是实时的,那么您就不需要模型——只需检查有多少点的 ExpiryDate 大于现在(即当您需要提供预测时),然后从点的总容量中减去它。

如果数据不是实时出现的,那么您可以使用一天中的时间和一周中的一天作为预测变量。您甚至可能希望将它们变成交互术语。您还需要决定多久调用一次模型并对数据进行分组,以便每一行代表在该时间范围内有多少票处于活动状态;这将定义您的目标变量(您要预测的内容)。

顺便说一句,我认为您指的是生存模型我会推荐梯度提升;它更强大。顺便说一下,梯度提升模型 (GBM) 是 R 中插入符号和 Python 中 scikit-learn 的一部分。