我知道这主要是一个统计网站,所以如果我跑题了,请重定向我。
我有一个泵系统,有时会损坏,需要更换。我希望能够预测故障,从而为更换泵的人员提供早期预警。我有泵过程的历史数据,例如流量、压力、液体高度等。
我在使用机器学习技术对数据进行分类方面只有少量经验——基本上我在 coursera 上跟随并完成了 Andrew Ng 的机器学习课程以及 Andrew Conway 的 Statistics One 的练习,并且我从未使用过机器学习对时间序列进行分类。我正在考虑如何改变我的问题,以便我可以使用我现有的知识。以我有限的知识,我不会得到一个非常理想的预测,但我希望从中学习,对于这个问题,任何小的预测改进都是有用的,而不是等待故障发生。
我提出的方法是将时间序列变成一个正常的分类问题。输入将是时间序列窗口的摘要,其中包含窗口中每种数据类型的平均值、标准偏差、最大值等。对于输出,我不确定什么效果最好。一种方法是输出将是泵是否在窗口结束后的特定时间段内发生故障的二进制分类。另一个是输出将是泵发生故障之前的剩余时间,因此不是分类,而是回归(在机器学习意义上)。
您认为这种方法可能会产生结果吗?是否是“取决于领域和历史数据”的问题。是否有我没有考虑过的更好的转换(输入和输出),或者基于时间序列数据的故障预测与更标准的故障预测有很大不同,我的时间最好花在阅读时间序列的机器学习上?