我有一组购买的 $ 值如下:{1, 1, 1, 2, 7, 8, 10, 10, 20, 20}。总和:80。平均值:8。
我原以为如果你把它分成相等的总和(40),这将发生在平均值(8)处。实际上,您必须在集合中的不同点进行拆分:{1, 1, 1, 2, 7, 8, 10, 10}, {20, 20}。
显然,我认为这是均值的属性是不正确的,这一点也不是中位数,但我觉得这是某种基本类型的平均值,因为我将数据分成相等的两半。
有这个名字吗?这是类似于但不完全是百分位数的一个例子吗?
我有一组购买的 $ 值如下:{1, 1, 1, 2, 7, 8, 10, 10, 20, 20}。总和:80。平均值:8。
我原以为如果你把它分成相等的总和(40),这将发生在平均值(8)处。实际上,您必须在集合中的不同点进行拆分:{1, 1, 1, 2, 7, 8, 10, 10}, {20, 20}。
显然,我认为这是均值的属性是不正确的,这一点也不是中位数,但我觉得这是某种基本类型的平均值,因为我将数据分成相等的两半。
有这个名字吗?这是类似于但不完全是百分位数的一个例子吗?
我从未听说过这样的统计数据,但我突然想到它作为集中趋势估计量具有可怕的特性:假设您的分布始终为正(负值实际上会使情况恶化),它也可能非常偏斜,这意味着您的统计将导致一个非常高的值,仅次于最高观察值。
例如,假设您的样本中的每个值都是前一个值的两倍,您的统计数据将选择它们中的最后一个值。
从概率的角度来看,这也是相当有问题的,而均值和中位数具有简单的概率含义。
这看起来像加权中位数
> x <- c(1, 1, 1, 2, 7, 8, 10, 10, 20, 20)
> median(rep(x, times = x))
[1] 15
如果不使用 R rep(x, times = x) 生成一个新向量,每个元素重复其自己的次数。请注意,这为您的示例提供了一个介于 10 和 20 之间的值,因为这就是它定义中位数而不是您引用的 20 的方式。
在对原始问题的评论中,Federico Poloni 提出了数据集 {1, 3, 4, 4}。如果我们将中位数的定义视为该值,使得不超过一半的观测值位于其上方且不超过一半的观测值位于其下方,那么此处的类似程序将取值使得上述值的总和它不超过总额的一半,反之亦然。所以答案是 3,因为任何其他值要么超过总和 (11) 的一半以上,要么低于它。
在另一个答案中,卡洛提出了一个有效的观点,即这是一个非常公平的集中趋势度量的不寻常选择。