给定一个显示平均值和控制上限/下限的控制图,我如何判断失控点的原因是否可分配?

机器算法验证 控制图 工程统计
2022-03-08 12:51:02

IEEE CSDA 实践考试 - 工程统计 - 控制图

我得到 15 分。控制限在 +/- 3点 1、4、5、6、7、8、9、10、11、13 和 15 在控制范围内。点 2、3、12 和 14 超出控制限,其​​中 2 低于控制下限,而 3、12 和 14 高于控制上限。σ

我如何知道第 2、3、12 和 14 点是否因偶然原因或可指定原因而失控?

4个回答

是的,您应该为超出限制的每个点找到可分配的原因。但事情有点复杂。

首先,您必须确定过程是否受控,因为当过程失控时,控制图是没有意义的。近 1/4 的观察结果超出限制是一个强烈的信号,表明该过程可能失控。查看图表将有助于确定过程是否在控制之下。

除了超出控制范围之外,还有其他潜在原因需要为某些观察寻找可分配的原因。例如,如果连续有多个观测值落在均值的同一侧——尤其是当它们接近控制限时——它们可能需要指定一个特殊原因。

如果您发布图表本身,我可能会更具体。

如果您想了解有关控制图的更多信息,SPC Press提供了许多有用的免费资源。您可能还想看看这本书:它简短、简洁且内容丰富。

(编辑:)

我以为我们谈论的是真实世界的数据,而不是考试题。在这种情况下,正确答案确实是第一个:控制范围之外的点(可能)是由可分配的原因引起的。

不过,该考试的术语有点草率:您实际上无法 100% 确定超出控制范围的分数不是偶然造成的。你只能说有 99.7% 的概率超出限制的特定点不是偶然造成的。

我对控制图的理解有点不同……在观察2的第一个信号之后,该过程不会停止并检查问题,然后重新启动吗?

在任何情况下,您都可以使用 p 值参数。如果过程实际上处于控制之中,则观察到 4 个或更多观察值(共 15 个)超出其控制限制的概率非常小。假设在过程实际受控时观察超出控制限的概率约为 0.01(此确切概率取决于数据的受控分布),因此如果过程处于受控状态,我们预计会出现错误每 100 次左右的观测值发出一次警报(即随机机会引起的失控信号)。在过程处于控制状态时观察到 4 个或更多失控信号(共 15 个)的概率约为 0.000012,因此这些信号不太可能是由于随机机会造成的。

虽然实际诊断需要您查看图表并可能实际调查物理过程,但由于失控点均低于和高于控制限制,我敢打赌存在比例偏移(即方差增加。 )

(抱歉发布新答案,我还不能直接回复评论)

我不太同意下面的说法:

“显然,如果您越过 UCL 或 LCL,则必须有一个可分配的原因”

为简单起见,如果您的控制分布为 N(0,1),那么平均每 370 次观察您仍会获得一次误报,使用 3 的 UCL 和 -3 的 LCL。当图表发出信号时,需要调查该过程。只有这样才能分配信号的原因(即过程更改或随机错误)。设置 UCL 和 LCL 需要用户平衡所需的误报/漏检率(类似于 I 类/II 类错误权衡假设检验。)

您也可以等到几个信号真正停止并调查该过程,但在这种情况下,如果它确实发生在第一个信号时,您可能检测到该转变为时已晚。同样,您不能一无所有,用户必须根据自己的判断来决定如何设置控制图和监控过程。

我在 IEEE 为这次考试准备的一份研究文件中发现了一些有趣的东西:

  • 落在 UCL 和 LCL 范围内的数据点被认为是可控的,并且是由偶然原因引起的。
  • 超出 UCL 或低于 LCL 的异常值被认为是失控的,并且是由可分配的原因引起的。
  • 如果一些点系统地高于或低于平均值(但在 UCL 和 LCL 内),这可能表明非随机失控状态。
  • 控制图的目标是快速检测失控状态。
  • 单独的图表不会指出事件的根本原因,但会提供调查线索。

显然,如果您越过 UCL 或 LCL,则必须有一个可分配的原因。

鉴于维基百科对可分配(特殊)原因特征的定义,这是有道理的

  • 系统内新的、未预料到的、涌现的或以前被忽视的现象;
  • 变化本质上是不可预测的,甚至是概率性的;
  • 历史经验基地外的变异;
  • 系统或我们对其知识的某些内在变化的证据。