我的问题是:是否有一组数据允许中位数大于众数,众数大于平均值,平均值大于范围?如果是这样,是否存在允许这种情况的模式或数据集的特定特征(可能是某种偏斜......)?
PS我已经纠正了我的拼写错误。已经给出的一些答案与中位数的相反情况有关
我的问题是:是否有一组数据允许中位数大于众数,众数大于平均值,平均值大于范围?如果是这样,是否存在允许这种情况的模式或数据集的特定特征(可能是某种偏斜......)?
PS我已经纠正了我的拼写错误。已经给出的一些答案与中位数的相反情况有关
是的,想出这样一套并不难。
S = {0, 1, 2, 3, 4, 4, 1000}
中位数 = 3,众数 = 4,平均值 = 144.85,范围 = 1000
此类数据将向右倾斜,因为您的平均值高于中位数,这意味着平均而言,高于中位数的值比低于中位数的值更远。
这个问题已经得到了肯定的回答,但是让我们从构造的角度来处理这个问题——我们如何制作一组数据来做到这一点?
首先,请注意,我们总是可以使所有三个位置度量都大于范围。只需构建一个具有中值 > 众数 > 均值的初步数据集并计算范围。现在将 (range-mean) + (对于一些小的正 ) 添加到所有数据值以获得最终数据集,因此三个位置度量都将超出范围。
因此,我们现在将问题简化为找到一个中位数 > 众数 > 均值的数据集。
想象一下,我们已经有了一些具有合适中位数和众数的数据。要使均值小于中位数和众数,您只需将单个值放在足够远低于均值被拉低的大部分数据的位置;我们可以在大部分数据的上方放置第二个值,以保持中位数不变,而无需更改模式。所以现在我们可以修改一个现有的数据集,它只是具有中值 > 众数,并在我们想要的地方获得一个具有平均值的数据集。
因此,让我们创建一个具有中值 > 众数的模型。我们可以通过重复一个值来做到这一点(如果它是唯一出现两次的值,那就是样本模式),然后添加足够多的其他值以使中位数更大。这是一个例子:
21, 21, 22, 23, 24
中位数为 22,但众数为 21。
现在让我们像前面描述的那样添加两个点,这样可以在不改变中位数或众数的情况下使平均值为 20。现在的点总和为 111,所以我们需要两个点相加为 140-111 = 29,其中一个应该比 24 稍大。让我们把它设为 25。那么较小的点是 29-25 = 4。
所以现在我们的数据集是:
4, 21, 21, 22, 23, 24, 25
它的平均值为 20,众数为 21,中值为 22。
现在让我们修复它们与范围的关系。范围是多少?它是 25-4=21,目前大于平均值。我们只需向每个数据值添加一些东西,使平均值大于 21,从而保持范围不变。添加2就足够了。(注意 range-mean+1=2,所以我们可以看到我们取了)
所以我们最终的数据集是
6, 23, 23, 24, 25, 26, 27
范围仍然是 21,平均值现在是 22,众数是 23,中位数是 24
因此,这种循序渐进的方法非常易于使用。总之:
通过重复最小值并使所有较大的值不同(使用排序值最容易)来制作一个具有中值 > 模式的小数据集。有 5 个点很方便(因为它可以让您通过移动中间值来指定中值),但如果需要,4 个点也是可行的。
通过添加两个不改变中位数或众数的点来获得低于中位数的平均值(即两个不同/单一的值不会干扰众数,并将它们放在先前数据的任一侧将保留中位数;放置较大的值就在所有当前数据之上,然后计算最小的,这样总平均值就在众数之下。这需要 7 个数据点。
计算范围。为所有数据值添加一个常数(范围 - 平均值 +),以保证平均值超出范围。这是最终的数据集。
在 R 中检查这些计算:
x <- c(6, 23, 23, 24, 25, 26, 27)
data.frame(
range=diff(range(x)),
mean=mean(x),
mode=max(as.numeric(names(table(x))[table(x)==max(table(x))])),
median=median(x)
)
range mean mode median
1 21 22 23 24
(请注意,如果我们以某种方式碰巧生成了多个模式,则此计算会尝试找到其中最大的一个)
不管顺序是什么,答案都是肯定的。作为分布子集的数据集,其左尾比右尾重,其众数通常小于中位数,中位数小于均值,均值小于范围。众数大于 1/2 的 beta 分布将具有该属性。如果一个人想要在任何特定位置拥有该模式,可以通过添加一小部分窄(小)标准偏差但高分布,例如,狄拉克,任何想要放置该模式的地方来制作混合分布。