我正在探索使用机器学习来预测特定硬件组件是否会在一段时间内发生故障,比如 3 个月。最终目标是尽量减少人工检查,以便维护人员始终在硬件故障之前及时进行维护/维修。
然而,无论硬件状况如何,维修都是以固定的时间间隔进行的,而且几乎从未失败过。我们拥有的数据集具有这种性质:
equipment: pump1
location: outdoor (or indoor)
provider: providerA
operation: -
temperature (as a function of time)
moisture (as a function of time)
team (as a discreet function of time, ie teamA, teamB, teamC)
基本上,我们知道设备的一些特性(这里是泵 1),我们知道一些操作参数(这里是温度、湿度)随着时间的推移作为函数,我们还知道哪个团队随着时间的推移进行维修。我知道生存分析最适合预测性维护问题,但每个操作参数都会随着研究时间的推移而变化。没有什么是一成不变的。
而回归不考虑时间。因此,我们如何实际对其建模以预测其失败?
注:以上参数改编自https://www.kaggle.com/ludobenistant/predictive-maintenance