四分位数之间的一组数字的名称是什么

机器算法验证 描述性统计 术语
2022-03-15 08:04:33

据我了解,四分位数是排名数据集中的三个点,将数据分成四个相等的组。

这些团体叫什么?我怎么说属于排名数据集的数字属于某个组?给这些团体起的各种名称是什么?

我也明白,当应用于不同的领域时,四分位数可能意味着其他东西,他们可能不会将其用作点,而是数据的范围。

1个回答

我认为没有一个普遍接受的答案。

有些人也乐于称组为四分位数并且因此明确或隐含地乐观地认为任何歧义都不会产生影响,或者至少可以在上下文中快速澄清,例如通过检查一些合适的表格、图形和/或代数定义。这种用法由来已久,有时以细微差别来区分,例如,四分位数(值)可以称为下四分位数中位数上四分位数,而四分位数(箱)可以称为第一、第二、第三和第四四分位数. (这种做法让我想起了那些希望均值作为总体数量而平均值作为样本数量的人,这对我来说似乎从来没有很有说服力,尤其是因为我真的希望可以自由地引用样本均值。)

其他人会将宿舍视为替代术语。

口头替代方案似乎都可以通过更冗长(并且对某些人来说更迂腐)来购买更高的精确度,例如基于四分位数的箱、类、组或间隔

在许多方面,最好的解决方案是完全避免使用特殊词:简单地量化并谈论第一个或最低的 25%,第二个 25%,等等[感谢@Glen_b 提醒我这种常见做法。]

另一种选择是完全避免使用任何此类术语,但这并不总是可能的。分位数也没有通用的表示法:例如,中位数有许多特殊的表示法,但似乎没有一个是常见的。

任何分位数都会出现相同的术语问题。

编辑 2020 年 10 月 8 日 自从这个答案以来的近五年里,我已经看到了由四分位数(通常是分位数)分隔的箱、类或间隔,通常用相同的名称来称呼。间隔和界定它们的水平之间的模糊性是不幸的,但似乎仍然存在。在实践中,歧义并不严重。起作用的自然选择是,诸如基于四分位数的垃圾箱之类的冗长术语显然似乎过于挑剔而无法获得青睐。