我们注意到我们的 A/B 测试中有一个有偏差的样本,并且想知道差异中的差异是否有助于我们对数据做出有效的结论,或者是否有其他方法可以继续。
我们在网站上进行了一项新实验,为 50% 的用户提供了一项新功能。我们将奇数 id 的用户分配到实验组,将偶数 id 的用户分配到对照组,然后运行实验。然而,我们发现即使在进行实验之前,两组之间也存在统计学差异。我们认为这是因为我们进行了许多实验,我们根据 id 的奇数/偶数进行分割,因此实验组中的人们已经看到了许多治疗方法。
所以吸取了教训,下次我们将掷硬币而不是使用 id。但是,我们想看看我们是否仍然可以从当前的实验中做出推论。我听说过一种叫做差异的东西。在这种情况下这会起作用吗,还是有其他更好的方法?理想情况下,我们不想放弃测试并重新开始,因为 50% 的用户已经看到了新功能。