我正在计划进行 n 次独立 A/B 测试(=运行最多 n 次测试,或者如果发现有很好的改进则提前停止)并且为了将显着性水平保持在可接受的水平内(=0.05)我'我考虑控制误报率的方法,同时保持样本量尽可能低(适用于低流量网站)
我知道 Bonferroni、Benjiamimi-Hochberg 和相关方法旨在控制多重比较情况下的误报比例。然而,计算样本量的问题仍然存在,最简单的方法似乎是按照 Bonferroni 校正的规定从 alpha = 0.05/n 开始计算所需的样本量,然后可能使用 Benjiamimi-Hochberg 进行实际测试。当使用 Benjiamimi-Hochberg 时,是否有更好的方法来计算样本量?
此外,由于 A/B 测试旨在测试可能的改进,我认为如果顺序测试基于独立样本,那么两个连续误报的概率将为 alpha^2 = 0.025。我的理解是,如果各个样本不引用相同的用户,则顺序测试将是独立的。例如,这些可能是在上次测试后加入网站的用户。
如果上述想法有意义,我可以使用“弱” Bonferroni(即 alpha' = alpha/(n*0.2) )校正,以便以合理的功效和较低的样本量运行测试,并且一旦发现阳性(零假设被拒绝),我可以重复测试,如果它再次为阳性,则结果为阳性,p < 0.025,这意味着我会接受结果。这种方法将允许对样本大小进行一些控制,但是......听起来不错吗?
任何意见将不胜感激。提前致谢。阿马尔