A/B 测试随机化步骤

数据挖掘 统计数据 测试
2021-10-01 17:42:02

假设我想测量药物对身高的影响。所以我随机将我的用户群分成两组(显然是对照组和实验组)。我在实验前计算了两组的平均身高,发现有 2 厘米的差异。然后,在给实验组上药后,我发现有4厘米的差异。

如果我没记错的话,t 检验不能处理选择偏差,我可以做一个测试来考虑组间最初的 2 厘米差异吗?

1个回答

据我了解,您根本不必担心这一点。

因此,您在控制和治疗中随机拆分了一个样本。您在治疗之前和之后对同一个人进行测量。因为您测量的是相同的个体而不是配对测量:delta = before - after。您有兴趣测量对照样本的 delta 平均值是否与对照样本的 delta 平均值显着不同。这是通过配对样本测试完成的,也称为相关测试。

如果您假设一个正态分布,您可以使用配对 t 检验如果您不能合理地假设正态分布,则可以使用Wilcoxon 符号秩检验

测试中配对的想法是消除混杂因素的影响。您计算的可能是混杂因素的影响,但如果样本在控制和治疗中被随机拆分,您不必担心,除非您有充分的理由怀疑随机化程序。在后一种情况下,您可能应该在方程中包含混杂因素并采取随机效应建模的路线。