我正在处理实时传感器数据集,并从可用数据集中寻找异常模式(导致机器故障情况)。
我正在学习并且对数据科学世界很陌生,但对 Python 很熟悉。我有几个问题希望得到建议。
- 哪种算法最适合这种情况?
- 在 python 中进行预测分析的基本步骤是什么?
如果我的问题没有正确表达,请纠正我。
我正在处理实时传感器数据集,并从可用数据集中寻找异常模式(导致机器故障情况)。
我正在学习并且对数据科学世界很陌生,但对 Python 很熟悉。我有几个问题希望得到建议。
如果我的问题没有正确表达,请纠正我。
您正在谈论异常检测,并且有很多方法。如果您可以创建训练集,则可以从一类 SVM 开始,但即使是简单的控制图也很有用,尤其是对于实时流数据。
如果您有一个带有标记异常的数据集,那么您可以使用二元分类方法。如果异常没有标记,那么您必须研究异常值/新奇检测。scikit-learn 文档有一个很好的概述。