用有限的数据预测硬件故障

数据挖掘 数据集
2022-02-08 16:18:14

我正在探索使用机器学习来预测特定硬件组件是否会在一段时间内发生故障,比如 3 个月。最终目标是尽量减少人工检查,以便维护人员始终在硬件故障之前及时进行维护/维修。

然而,无论硬件状况如何,维修都是以固定的时间间隔进行的,而且几乎从未失败过。我们拥有的数据集具有这种性质:

equipment: pump1
location: outdoor (or indoor)
provider: providerA
operation: -
   temperature (as a function of time)
   moisture (as a function of time)
   team (as a discreet function of time, ie teamA, teamB, teamC)

基本上,我们知道设备的一些特性(这里是泵 1),我们知道一些操作参数(这里是温度、湿度)随着时间的推移作为函数,我们还知道哪个团队随着时间的推移进行维修。我知道生存分析最适合预测性维护问题,但每个操作参数都会随着研究时间的推移而变化。没有什么是一成不变的。

而回归不考虑时间。因此,我们如何实际对其建模以预测其失败?

注:以上参数改编自https://www.kaggle.com/ludobenistant/predictive-maintenance

2个回答

这取决于你所说的失败是什么意思。正如 el burro 所提到的,如果有一个代理可以用作标签,那么您仍然可以在数据集上执行 ML。

我不是机械工程师,但我在化工厂工作过,这里有一些建议作为泵故障的代理。

  1. 泵速(如果是定速泵)
  2. 转子扭矩
  3. 电源输入?(如果是变速驱动器)

也许您可以尝试使用上述参数作为标签,并使用回归来预测参数进入不健康水平?当然,理想情况下,回归应该用于插值,但如果您的数据离故障限制不太远,您可以获得不错的结果。

您可以使用代理来解决硬件故障吗?类似于可能失败的状态?然后你可以尝试预测这个应该更常见的状态,并使用一个软糖因素来解决你的失败。