如果总和的中位数或平均值大于加数的总和,这意味着什么?

机器算法验证 随机变量 中位数
2022-03-15 22:35:19

我正在分析网络延迟的分布。中位上传时间 (U) 为 0.5 秒。中位下载 (D) 时间为 2 秒。然而,中位总时间(对于每个数据点,T = U + D)是 4 秒。

知道和的中位数远大于加数的中位数之和,可以得出什么结论?

只是出于对统计数据的好奇,如果这个问题用平均值代替中位数意味着什么?

1个回答

中位数不是线性的,因此在多种情况下会出现类似的情况(即median(X1)+median(X2)<median(X1+X2)) 可能发生。

构造发生这种事情的离散示例非常容易,但在连续情况下也很常见。

例如,它可能发生在倾斜的连续分布中——右尾重,中位数可能都很小,但总和的中位数被“拉高”,因为两者中的一个很可能很大,并且值高于中位数通常会远高于它,使总和的中位数大于中位数的总和。

这是一个明确的例子:采取X1,X2i.i.d.Exp(1). 然后X1X2有中位数log(2)0.693所以中位数之和小于1.4, 但X1+X2Gamma(2,1)其中有中位数1.678(实际上W1(12e)1根据 Wolfram Alpha)

指数(1)和伽玛(2,1)的密度显示两者的中位数; 很明显,指数(1)的中位数小于伽玛(2,1)的一半