在对我们的 CRM 工具(Oracle Responsys,但这可能适用于任何人)进行了 6 个月的 AB 测试后,测试显示出一些奇怪的结果,因此我们决定暂停一切,并进行一些好的旧 AA 测试。
AA 测试包括在两个分支之间随机划分用户,使两个分支具有完全相同的体验,并测试两个分支的转换率没有显着差异,这意味着两个分支实际上没有被同等对待(或者人口不是均匀分布在两个分支之间)
可以想象,这根本没有发生。我们向每个分支机构发送了大约 3500 封邮件,其中一个展示了 40% 的转化率,而另一个只有 32%,这是一个 p 值约为 10^-12 的差异
此外,我们将时间划分为 4 个时期,每个时期都与另一个时期表现出非常显着的差异。
现在我该怎么办?我想在 Oracle 的支持下对此进行理论上的讨论,但是当然,看到 AA 测试出错的每个人都会认为您没有尊重正确的方法。
我的问题:我想要一些在数据科学方面比我更有经验的人的建议,以帮助我:
- 以最清晰的方式表达我的问题,让向我出售此解决方案的公司对这里的问题感兴趣
- 了解我是否忘记检查我这边的任何内容来解释这种差异
从我们的服务器到最终客户端使用的确切过程是:
我们每 x 小时向 Responsys 发送数百人的列表
Responsys 应该使用 java.util.random.nextfloat() 生成的随机数以独立且同分布的方式影响它们
然后过滤列表以删除无法送达的人,并且每个分支都发送完全相同的电子邮件
Oracle 在他的描述中非常简洁,但我认为他们文档中的以下几行应该描述一个 iid 均匀分布。
在启动期间,对于每个电子邮件收件人:
一个。使用 java.util.Random.nextFloat() 生成范围为 [0, 1] 的随机数
湾。决定这个随机数所在的桶
C。将该存储桶中的活动发送给收件人


