我有一个以离线 csv 格式提供的时间序列数据。我正在使用这些数据来创建异常检测模型。虽然我可以创建这个模型来预测这个数据集中的异常,但是当数据是实时的时候我需要使用这个模型。每隔一个数据点就会出现,然后如果点异常,我需要模型来引发异常。
任何想法我应该如何实现这个?
编辑 - 计算机中的数据会定期更新,文件会随着数据仅在此文件中流式传输而更新。实时异常检测需要预测,因为当做出这种异常检测预测时,必须做出停止该过程的决定。
我有一个以离线 csv 格式提供的时间序列数据。我正在使用这些数据来创建异常检测模型。虽然我可以创建这个模型来预测这个数据集中的异常,但是当数据是实时的时候我需要使用这个模型。每隔一个数据点就会出现,然后如果点异常,我需要模型来引发异常。
任何想法我应该如何实现这个?
编辑 - 计算机中的数据会定期更新,文件会随着数据仅在此文件中流式传输而更新。实时异常检测需要预测,因为当做出这种异常检测预测时,必须做出停止该过程的决定。
这取决于对这些问题的回答:
在这样的环境中使用数据库是很常见的。因此将定期调用 ML 预测过程,查询该数据库以获取最新实例并生成所需格式的预测(可能也将预测存储在数据库中)。
我有类似的情况,模仿文件数据,就好像它们是实时流式传输一样。您可以使用“计划”/时间库每 x 秒/毫秒读取一次文件。您需要将代码的整个操作/预测部分放在一个“计划”将每 x 秒触发一次的函数中。希望这可以帮助。