是对假设不满足的数据的 Mann Whitney 检验与假设满足的数据的 t 检验一样或几乎强大吗?
像“一样强大”这样的短语并不能作为一般性陈述。
在不同的分布式模型中,功率并不是特别具有可比性。给定效应的大小在分布的不同部分具有不同的含义。想象一下,你有一个非常高的分布,但有一个沉重的尾巴;通过什么衡量我们可以说特定大小的偏差类似于具有更“平坦”的中心和更小的尾巴的东西?一个小的偏差可能很容易被发现,但一个大的偏差可能(相对于我们试图比较权力的其他分布可能性)更难。
有两组可能的正态分布,一组具有大 sd,另一组具有小 sd,很容易说‘好吧,功率只会随标准差成比例;如果我们根据标准偏差的数量来定义我们的效应大小,我们可以将两条功率曲线联系起来。
但是现在有了不同形状的分布,没有明显的规模选择。我们必须对如何比较它们做出一些选择。我们做出的选择将决定它们如何“比较”。
例如,当数据是 Cauchy 时,我如何比较功率与当数据是缩放的 beta(2,2) 时的功率?什么是可比效应大小?下面的 Cauchy 在 -1 和 1 之间的分布更多,在 -3 和 3 之间的分布比另一个少。例如,它们的四分位距不同。我们比较的依据是什么?

如果你能解决这个难题,现在考虑一个分布是否向左倾斜,另一个是双峰分布,或者是无数其他可能性中的任何一个。
您仍然可以在任何特定的一组假设下计算功效,但是在不同的分布假设下比较一个测试而不是在给定分布假设下的两个测试在概念上非常棘手。