零假设显着性检验似乎在商业中被广泛使用。最明显的例子是 A/B 测试,其中企业将执行测试,比较其业务某些方面的两个变体,旧的和新的,如果测试显示出积极的差异,则切换到新的变体。作为一名 MBA 学生,我注意到 NHST 似乎是教授给大多数商科学生的唯一方法。
我不禁想到“A和B之间的差异在统计上显着吗?”这个问题。有时与“我应该选择 B 而不是 A?”非常不同,但我们被教导使用前一个问题来确定后者的正确答案。例如:
两个条件之间的统计显着差异并不意味着这种差异大到足以抵消其他因素。例如,切换到新变体本身的成本可能大于变体之间的统计显着差异带来的新收入。
在某些情况下,我们可能没有足够的数据来发现统计上的显着差异,但使用我们确实必须为决策提供信息的数据可能仍然有意义。例如,如果选择一个变体或另一个变体不花费任何成本,那么选择具有更大期望值的变体可能是有意义的,即使我们不能确定差异是否显着。这个想法是,我们不一定对 95% 的时间是对的感兴趣,而是对正确的次数比我们错误的次数或更大的错误次数感兴趣。
然而,在实践中,仅根据是否拒绝原假设来做出决定似乎很常见。统计测试似乎会自动给分析带来严谨的氛围,通常足以支持结论,而无需过多讨论在这种情况下对测试的正确解释应该是什么。那些认识到 NHST 在这方面存在一些局限性的人通常会说“有总比没有好”来消除这些限制,但我觉得在某些情况下,不幸的是,事实可能并非如此。
我的问题是:这些担忧是否合理?NHST 何时以及如何适合在商业中使用?