预测组件何时会失败并获取其参数数据

数据挖掘 机器学习 Python 时间序列 预言
2022-02-18 23:03:20

我有一个组件,我需要预测它何时会磨损并需要更换。我监控,比方说这个组件的 5 个参数,每个运行周期都会监控每个参数。因此,数据集可能如下所示:

No_of_runs    Para1    Para2    Para3    Para4    Para5
1              100      32        45      230       86
2              101      34        65      234       90
3              120      24        32      242       80
4              105      45        40      213       75
5              90       42        54      200       77
...            ...      ...       ...     ...       ...

除了上述内容之外,我还有一个数据集说明该组件在过去何时需要更换。因此,如果上述数据集达到 500 行(组件的运行周期),则另一个数据集表示组件需要在 50、130、340、400 周期内进行替换。

基于这些数据,目标是创建一个模型,该模型能够预测该组件将来何时会发生故障,并为其提供到目前为止的参数数据。

我很难想出解决问题的方法,而且由于我在该领域没有太多经验,我不确定该采取哪种方法。

这是一个有监督的问题,但我不确定如何整合组件“退化”的信息(运行周期)或如何构建我的特征矩阵。

1个回答

在我看来,这就像一个序列标签问题,其中类是二进制的,表示组件是否仍在工作或失败。在此选项中,您应该构建一个训练数据集,每个周期如下所示:

No_of_runs    Para1    Para2    Para3    Para4    Para5    status
1              100      32        45      230       86       ok
2              101      34        65      234       90       ok
3              120      24        32      242       80       ok
4              105      45        40      213       75       ok
5              90       42        54      200       77       ok
...            ...      ...       ...     ...       ...
1234           ..       ..        ..      ..        ..       fail

实例的顺序很重要。训练后,模型可以告诉您给定运行顺序的实例失败的概率

条件随机场是此类问题的标准选项。