假设我正在测试一台新机器的有效性。目前的机器有20%的成功率,也就是每生产100个小部件,就可以卖出20个。
现在我开发了一个新原型,我想知道它是否性能更好。此外,只有在性能提高 10%(即 22% 的成功率)的情况下,投资新机器才有意义。
所以我建立了一个实验并收集了这些数据:
machine attempts successes
---------------------------------
Original n1 k1
Prototype n2 k2
假设
* alpha
= 5%
* beta
= 20%
* 我想使用尽可能小的样本量。
我的理解是,通常我想要一个 2 尾比例差异测试。但该测试只能告诉我两台机器的性能是否不同,而不是一台机器性能好 10% 或更多。
如何确定使用什么样本量,使用什么合适的测试,以及如何报告差异的大小?