基于日期、时间和位置预测设备状态(ON/OFF)的 ML 算法

数据挖掘 机器学习
2022-03-04 09:24:23

我需要开发一种机器学习算法来预测是否应根据用户的汽车使用情况在一天中的任何给定时间将二次汽车电池连接到负载。(输出为 1 或 0 ,ON 或 OFF)

一些背景:我的项目车配备了一个二次电池,它必须运行汽车电脑,LTE调制解调器等。所以电池不要一直连接到这些负载,以延长电池的运行时间,这一点很重要不使用汽车时(汽车运行时,主汽车电池为二次电池充电。)。这些电子部件用于物联网操作、运行alexa语音交互等。

所以有必要预测用户在什么时间使用他的车,并在司机真正上车之前打开电路,这样它就可以在他进入汽车后立即与用户开始alexa语音交互,没有任何延迟(如果它在用户进入后开始,所有互联网连接都需要一些时间才能启动并运行。)。

关于我可以在这里使用的现有机器学习算法有什么建议吗?首先,我计划仅根据日期、时间和位置来预测状态。例如,如果时间是上午 7 点,工作日,并且位置是家,那么汽车通常是 ON 去上班。如果时间是上午 10.00 并且位置是办公室,汽车通常是 OFF。

请帮助我提出任何可以改进概念的想法/建议。

1个回答

您需要预测 2 个类别(开/关)。第一个问题是:根据什么数据(确切地)发生这种情况?

问题陈述

你确实有一些训练数据,所以这是一个有监督的学习任务。算法的选择实际上取决于确切需要什么数据以及您希望检测到哪种模式的问题:

  • 是基于单个用户(那时数据将稀缺)还是基于多个用户(足以确定相似用户进行预测)的预测
  • 考虑白天+周/周末真的足够了吗?公共假期或季节,使用行为可能会发生变化怎么办?
  • 休假时间是否会影响超出日期/时间的使用行为?

选择算法

一旦您现在基于哪些数据,您将识别出您认为适合的算法的哪种模式。例如:如果你真的只需要时间+工作日/周末,那么非常简单的算法可能就可以了。例如决策树(使用简单的规则,就像工作日 + 早上 7 点然后打开)。

如果规则需要更复杂(我认为这里就是这种情况),您可能需要更复杂的模型。我对基于时间的预测几乎没有经验,但我想到了诸如循环神经网络之类的东西,它们大量用于基于时间的预测(例如,网络分析,以发现任何给定时间点的使用模式异常)。

关注点

您的问题听起来像您需要一个非常准确的预测(精确到分钟),而实际的用户行为会更加随机(有时更早,有时更晚)。如果事件的实际时间在平均值附近波动,许多算法试图减少通常导致中间值的错误。

使用神经网络时,您可以影响误差的计算方式,并且可以对其进行训练,以使一种误差(早期)优于另一种误差。这使它变得更加复杂,并且要求“过早”不是问题(或者用户总是非常可靠)。