在统计学中,我们经常对调查某个人群(比如说富人)的某个分数(比如说生活满意度)是否比另一个人群(比如说穷人)更大感兴趣。大多数情况下,这个研究问题是通过检验均值的零假设来形式化的。但是,为了使均值比较有意义,感兴趣的变量必须至少在区间尺度上。因此,对于序数数据,应使用其他形式化。
两种形式化通常用于序数数据。中位数相等和随机相等,定义为,其中是代表两个总体的随机变量。许多论文认为随机等式是更好的形式化。核心论点是,即使一个总体的分数明显更大,中位数也可以相等。和的以下混合分布为例。概率为 0.5只是,概率它是从中采样的。同样,概率为 0.5,仅为的概率从中采样。因此,,而的没有实现更小比的任何实现和的实现都大于的所有实现。
因此,我们是否应该停止测试中位数的相等性,或者是否有研究问题中位数的相等性是合适的问题?如果是,那些是什么?