我有一个数据集,其中包含来自工厂生产线的数百个 pH 测量值。该数据集将用于使用 Minitab推断过程能力。
在物理基础上,pH 是一个连续的尺度(溶液中游离氢离子浓度的负对数)。然而,由于测量仪器的分辨率(读数为 0.01)和相对较窄的值范围(最小值:3.34,最大值:3.74),测量可以获取的离散值数量有限。
查看数据,它确实似乎是正常的,但是 Anderson-Darling 检验给出的 p 值 <0.05,表明数据不正常:
如果我使用“与过程变化相比较小”的正态分布噪声( = 0, = 0.005)对数据进行抖动,则分布不会以任何有意义的方式发生变化。相关的人口参数和/或视觉)。但是,AD 检验给出了更高的 p 值,表明数据的正态性:
来自 6 Sigma 绿带背景,正常为王,骚扰数据是严格禁止的,这感觉就像一个难题。我想使用该数据集来估计过程能力,但是 Minitab 警告我非正态性(我以前的 6σ 教练也是如此)。
因此,我的问题有两个:
1)我可以使用原始(非抖动)数据来推断过程能力吗?
2) 是否需要抖动和/或在能力分析之前预处理数据的有效方法?



