我确信这是一个非常直截了当的问题,但它出现在我今天的工作中,我想不出它背后的原因。
我有两组数值(A 和 B),正在查看它们的比率的中位数,并注意到中位数(A)/中位数(B)不等于中位数(A/B),我想知道是否有人可以解释为什么不。似乎有人可能认为它们是平等的,但事实并非如此。我还注意到,当 A 和 B 的范围分别较小时,中位数(A/B)似乎非常接近中位数(A)/中位数(B),但在较大的范围内,这两个值似乎有所不同。
我确信这是一个非常直截了当的问题,但它出现在我今天的工作中,我想不出它背后的原因。
我有两组数值(A 和 B),正在查看它们的比率的中位数,并注意到中位数(A)/中位数(B)不等于中位数(A/B),我想知道是否有人可以解释为什么不。似乎有人可能认为它们是平等的,但事实并非如此。我还注意到,当 A 和 B 的范围分别较小时,中位数(A/B)似乎非常接近中位数(A)/中位数(B),但在较大的范围内,这两个值似乎有所不同。
这是数学的一个性质,实际上很少有运算顺序无关紧要,例如平方根的对数与对数的平方根不同(除了少数特殊情况)。
我们经常关注一些特殊情况,由于操作分布、关联和通勤(闪回到代数,哦不!)我们可以按任何顺序做事。例如,要计算平均值,我们可以将数字相加,然后将总和除以,或者我们可以将每个数字除以然后对这些值求和。这是因为除法(乘法)分布在加法之上。对于配对数据,我们有一个事实,即差异的平均值就是平均值的差异。但这些是罕见的情况,而不是规则。
所以一般来说,当你以不同的顺序做事情时,你不应该期望得到相同的结果,比率的平均值也是平均值的比率也不正确,那么为什么中位数应该是正确的呢?
您可能会更惊讶地发现,即使使用像期望这样的良好线性运算符,您仍然会遇到这个问题(中位数是非线性的,均值是线性的):
例如:
a=1:5
b=6:10
mean(a)/mean(b)
[1] 0.375
mean(a/b)
[1] 0.3543651
但是你应该已经知道了,所以也许这根本不应该令人惊讶!
呃,由于(很明显?)一个数字的小数表示不是唯一的原因,中位数不能相同。
编辑:根据格伦的要求
中位数的位置取决于您的集合中数字的顺序。假设您按照从小到大的顺序排列您的数字,所以您有这样的 {1,2,3}。如果仅在转换保留顺序的情况下执行转换,则可以保持相同的中位数。例如,如果您将 1 加到集合中的每个数字中,中位数的位置不会改变:{2, 3, 4},即它仍然位于第二个位置。
任何线性变换都保持顺序。维持秩序是关键。这就是下面真正提到的“数学属性”。(以及如何定义顺序也是关键。请注意,顺序本质上是距离的概念。2 比 4 更接近 3,因为 2 和 3 之间的距离小于 2 和 4 之间的距离)。这就是为什么对于正数据,在某些情况下,允许对数据应用对数转换 - 您没有从根本上改变数字的顺序,因此您没有改变变量之间的潜在关系。您可以对收入数据进行对数转换,但不能对通货膨胀数据进行对数转换。
如果变换不是线性的,则不一定保持顺序。将每个数字转换为分数不是线性转换,因为数字的分数表示不是唯一的。1/2 与 2/4 相同。这就是为什么如果您按照您描述的方式将数字转换为分数,“大”设置中位数变化的位置。对于足够大的集合,您最终会遇到在多个位置具有相同分数的情况。如果发生这种情况,您的集合会“缩小”,因此中位数必须改变。