这种工业过程监控的正确数据分析方法

数据挖掘 机器学习 数据挖掘
2022-02-15 10:07:17

我是一名研发操作员,负责为我们的生产过程实施监控系统进行评估研究。我概括了软件必须做什么,但我不知道执行我设计的方法/算法是什么。
以下是过程描述:
我们生产制动软管。软管是在连续过程中生产的。它从 (1) 挤出一根塑料管开始,该塑料管被包裹在大约 1000 吨的卷轴中。然后 (2) 这些 1000 吨的挤压管用纺织品或钢丝编织。最后阶段 (3) 是用具有“T”头的挤出机对阶段 (2) 的编织管进行涂层。最后,我们得到成批的制动软管,卷筒重约 1000 吨。此过程中的变量由传感器检测,依次为:
(1)-挤出机速度-温度-真空压力
(1)-挤出管的直径
(1)人工操作
(2)编织机的速度
(2)编织室的温度和湿度
(2)人工操作编织机
(3) 涂层挤出机速度 - 温度 - 真空压力
(3) 涂层软管的直径(制动软管 = 过程输出)
(3) 人工操作
(3) 实验室对制动软管进行的测试
此过程是在时域中,因为三个阶段按时间顺序排列,并且该过程是线性过程(它从内胎的挤压开始,到其涂层结束)。
实验室操作人员将对由唯一的批处理代码标识的成品(过程输出)执行测试。软件必须将这些数据和阶段 (3) 中检测到的直径与批次软管过程的传感器数据相关联。
每次我们将数据输入系统时,软件都必须学会识别模式并找到变量之间的相关性。
例如:去年我们遇到了软管泄漏问题,该问题未确定并在一个月后消失,而对该过程没有采取任何重大措施。如果该软件已经实施,我们期望它的分析结果如下(用口语简化):
-“我在“保压”试验中检测到第3批次与第2批次和第1批次一样有泄漏。在所有这些批次中我检测到这三个因素并存:
1)存在操作员 John Doe 停止编织机 2 次
2) 编织室的湿度比过去 3 个月的平均水平高 2%
3) 用于挤压内胎(阶段 1)的塑料颗粒已经干燥仅 20 分钟而不是 40 分钟。

当然,下一次该过程显示与上面列出的相同条件时,软件会警告我们可能会发生相同的缺陷。

哪种算法(监督-强化-非监督)最适合这项任务,哪种方法(决策三神经网络?当我正在研究提交给最高管理层时,我想做好充分准备并且不要依赖软件公司所说的最好的解决方案,因为当有人对争论一无所知时,它们往往是“聪明的”。
谢谢
Alessio Cazzaniga

2个回答

您正在查看的问题是可靠性工程领域中常见的研究问题。如果我正确理解了您的示例,您的目标是了解以下内容:

什么制造条件导致某些零件(在您的情况下是软管)比其他零件更快失效?

对于您提到的每个变量,您必须确定这些变量在零件的整个生命周期内是否保持不变,或者它们是否会发生变化。在这里,我将时间测量为您的客户在生产中使用零件后所经过的时间。在可靠性工程中,不随时间变化的变量,例如制造过程的人工操作员、生产批次等,被称为与时间无关的协变量,这些变量随时间变化,例如生产中软管上的压力量(如果在您的客户站点读取此类信息的传感器)称为时间相关协变量

您将不得不转换您的数据,使其成为经过审查的生存数据。这种类型的数据意味着每个因变量都是生产运行的时间量由于您的某些软管可能永远不会有缺陷,因此它们将离开您的观察期。请注意,您也需要考虑这些要点。当你结合所有这些数据点时,你会得到一种叫做右删失生存数据的东西。

使用正确的删失生存数据和协变量,您可以开始构建加速故障时间模型请注意,建议先从Kaplan Meier对您的生存率的估计开始,然后再深入了解 AFT,但我只是想给您一些建议。

我强烈推荐的一本关于可靠性工程的书是:

两者都没有深入研究 AFT,但他们确实解释了物理系统的基本原理以及它如何与统计数据联系起来。根据经验,我知道在这个领域工作的人并不多,而且你可能有很多错误的指示。

在生产中引入这样的模型在很大程度上取决于数据的质量。通常,传感器数据的质量可能很差,而且,用户输入的质量往往更差。可以在这里找到一篇文章,让您了解您可能面临什么样的组织挑战。预计这样的项目需要几个月到几年的时间。

我认为在这种情况下随机森林是合适的。

如果您有注释历史数据(您描述的所有变量的记录以及试管通过或失败的记录),您可以构建一个随机森林,确定变量重要性,并将分类数据(人工操作员)和连续数据(温度,压力...)到管的结果。随机森林的一个好处是可以更容易地用决策树来描述它们。R 有一些很好的决策树可视化工具,根据我的经验,管理层比其他方法更容易接受决策树。

如果您需要更多详细信息,请告诉我,我可以编辑此回复以包含一些关于随机森林的来源,或更深入的解释。