数据挖掘 - 时间序列数据：如何将其转换为流数据？ - 吾爱随笔录

数据挖掘机器学习 Python 时间序列

2022-01-24 21:08:40

我有一个以离线 csv 格式提供的时间序列数据。我正在使用这些数据来创建异常检测模型。虽然我可以创建这个模型来预测这个数据集中的异常，但是当数据是实时的时候我需要使用这个模型。每隔一个数据点就会出现，然后如果点异常，我需要模型来引发异常。

任何想法我应该如何实现这个？

编辑 - 计算机中的数据会定期更新，文件会随着数据仅在此文件中流式传输而更新。实时异常检测需要预测，因为当做出这种异常检测预测时，必须做出停止该过程的决定。

2个回答

这取决于对这些问题的回答：

在这样的环境中使用数据库是很常见的。因此将定期调用 ML 预测过程，查询该数据库以获取最新实例并生成所需格式的预测（可能也将预测存储在数据库中）。

我有类似的情况，模仿文件数据，就好像它们是实时流式传输一样。您可以使用“计划”/时间库每 x 秒/毫秒读取一次文件。您需要将代码的整个操作/预测部分放在一个“计划”将每 x 秒触发一次的函数中。希望这可以帮助。

其它你可能感兴趣的问题