二元假设测试是比 A/B 测试更好的统计术语吗?

机器算法验证 假设检验 测试
2022-04-02 04:27:44

二元假设测试是商业智能通常称为 A/B 测试的更好的统计术语吗?Wikipedia建议这是在统计社区中使用的术语,但 Wikipedia 不可靠,并且此处没有此类术语的标签。由于多组随机实验的统计比较早于术语 A/B 测试和商业智能领域,我怀疑有一个术语。它只是维基百科建议的“二元假设检验”吗?一些历史背景也将受到赞赏。

3个回答

Wikipedia 文章包含有关 A/B 测试的准确信息;二元假设测试是 A/B 测试的另一个名称。A/B 测试和拆分测试是商业和营销社区中最广泛接受的术语。A/B 测试的确切起源并不为人所知,但可以追溯到千禧年之交的谷歌“谷歌工程师在世纪之交进行了他们的第一次 A/B 测试,以确定在搜索引擎结果页面上显示的最佳结果数量。”

“二元假设检验”是当人们想要在两个假设之间做出决定时的假设检验。

“双样本假设检验”就是俗称的 A/B 测试。

“配对假设检验”当您在事件之前和之后比较同一样本以发现它是否有影响时。类似于 A/B 测试,但不是 A/B 测试。

我同意其他非常好的答案。我认为,主要是工程背景更喜欢 A/B 测试这个术语,而在过去的几年里,它已经成为一个非常热门的术语,尤其是在网站优化的背景下。

请记住,除了 A/B 测试之外,您可能会遇到以下术语:

  • A/B/C 测试,您可以针对 2 个替代群组评估一个控制群组。
  • A/A 测试,您凭经验评估针对 I 类错误的统计测试的质量和稳健性(测试应返回群组没有差异)。