我正在调查我们的两个流程是否正在生产具有相同或不同平均测量值的产品。
第一个过程已经使用了很长时间,因此我有一个 430 次测量的样本量。
第二个过程非常新,只有 15 次测量的样本量。
我已经进行了 F 检验来比较我现在拥有的样本方差,并且我没有证据表明样本的方差不同。
当我对平均值的差异进行 t 检验时,我得到的结果表明两个过程的测量值之间存在非常显着的差异。
是否有任何测试可以实现 t 检验的目标,但也会控制或考虑非常大的样本量差异?
我正在调查我们的两个流程是否正在生产具有相同或不同平均测量值的产品。
第一个过程已经使用了很长时间,因此我有一个 430 次测量的样本量。
第二个过程非常新,只有 15 次测量的样本量。
我已经进行了 F 检验来比较我现在拥有的样本方差,并且我没有证据表明样本的方差不同。
当我对平均值的差异进行 t 检验时,我得到的结果表明两个过程的测量值之间存在非常显着的差异。
是否有任何测试可以实现 t 检验的目标,但也会控制或考虑非常大的样本量差异?
Welch 逼近 t 检验旨在做与独立样本 t 检验相同的事情,但不依赖于方差相等的假设。它在大多数标准统计软件中都很容易获得。在 R 中,它实际上是t.test函数的默认值(参数var.equal控制是否执行 IST 或 Welch 近似)。这是一篇有趣的博客文章,提倡使用 Welch 近似值,无论您是否认为您可能违反了等方差的假设。
特别是如果您有非常不等的样本量,您可能希望使用自举法,因为它根本不对样本统计量的分布做出任何假设。以下是另一篇 SE 帖子中关于引导 t 检验的说明。
t 检验不依赖于相等、相似甚至接近的样本量。可以对任何样本大小进行 t 检验。继续使用您拥有的 t 检验。我希望我知道人们从哪里得到 t 检验需要相同样本量的想法。