四分位距超过中位数

机器算法验证 描述性统计 变化性
2022-04-02 17:57:35

当四分位距超过中位数时,可以推断出数据集的分散性是什么?这是否总是表明存在很大程度的可变性?从 IQR 相对于中位数的大小可以推断出该数据集的任何其他摘要陈述吗?

2个回答

请注意,IQR 永远不会是负数,但中位数肯定可以是负数;目前尚不清楚将两者进行比较通常是否有意义,因为一个是位置度量,另一个是传播度量。

如果您的数据被限制为始终为正(但没有提到此类限制),您可以计算类似于变异系数的东西(通过计算 IQR/中位数的比率)

这将是相对可变性的度量,并且是无单位的,就像变异系数一样。那么至少有必要问“这样一个超过 1 的比率是否表明存在大量的相对可变性?”

但是,答案是,我们真的不能说;这取决于对您来说什么是“大”。没有明确的绝对标准。(CV 也没有一个绝对标准 - 一个可以将特定值算作“大”或“小”的标准,尽管在某些应用领域你可以找到经验法则——如果你有一些假设的分布和CV 的一些经验法则阈值,有可能找到 IQR/中位数大致对应的规则;至少在某些条件下可能是这样。)

通常,将 IQR 与中位数进行比较不会让您对离散度有任何额外的了解。例如,考虑以下分布:

在此处输入图像描述

它们具有相同的 IQR;事实上,它们是相同的副本,只是沿 x 轴移动。但是 IQR 大于分布 1 的中位数,而分布 2 则小于中位数。此外,请考虑任何中位数小于 0 的分布的 IQR 大于中位数。