确定两个比例之间差异量的正确方法是什么?

机器算法验证 假设检验 二项分布 样本量 规模效应
2022-04-08 02:14:20

假设我正在测试一台新机器的有效性。目前的机器有20%的成功率,也就是每生产100个小部件,就可以卖出20个。

现在我开发了一个新原型,我想知道它是否性能更好。此外,只有在性能提高 10%(即 22% 的成功率)的情况下,投资新机器才有意义。

所以我建立了一个实验并收集了这些数据:

machine     attempts   successes
---------------------------------
Original      n1         k1       
Prototype     n2         k2         

假设
* alpha= 5%
* beta= 20%
* 我想使用尽可能小的样本量。

我的理解是,通常我想要一个 2 尾比例差异测试。但该测试只能告诉我两台机器的性能是否不同,而不是一台机器性能好 10% 或更多。

如何确定使用什么样本量,使用什么合适的测试,以及如何报告差异的大小?

1个回答

您可以进行单侧测试,但即使您进行双侧测试,超过阈值的一侧也会清楚地告诉您您是更好还是更差。

标准假设检验仅告诉您您明显更好,但不是数量级。为了显示幅度大于指定的,需要更大的样本量。而不是测试你测试Δp1p2>0p1p2>Δ