“百分位”的定义

机器算法验证 数理统计 分位数 定义
2022-03-19 11:56:40

我现在正在阅读 PMT Education 撰写的关于 Biostatistics 的注释,并注意第 2.7 节中的以下句子:

体重在第 50 个百分位出生的婴儿比 50% 的婴儿重。
体重在第 25 个百分位出生的婴儿比 75% 的婴儿重。
体重在第 75 个百分位出生的婴儿比 25% 的婴儿重。

但据我所知,体重在 25% 时出生的婴儿应该比 25% 的婴儿重。这个领域有没有对“百分位数”的特殊定义,还是我把句子误解为非母语人士?

2个回答

虽然Stephen Kolassa给出的百分位数定义在统计理论中在技术上是正确的(最好的正确?),但这是一个在实践中存在很大差异的问题——有些人将百分位数最高的百分位数称为最大值,但其他人将其翻转,以使最高百分位数为最小值。在后一种情况下,人们有时会谈论某人在前5% 时,而不是在底部5%的。有时他们会明确地说出这一点(例如,约翰·史密斯的铅球距离在前 5 个百分位),但有时他们不会明确说明这一点。出于这个原因,与读者/演讲者澄清他们定义百分位数的方式总是很重要的。(在没有任何相反规范的情况下,他们应该真正使用标准的统计定义。)

另外,我有一点不同意斯蒂芬的观点。我怀疑这是一个印刷错误。更有可能的是,该文件的作者只是在说我所描述的第二种意义上的百分位数,虽然在技术上不正确,但仍然很常见。我并不认为这是一个“错误”,而是该术语的非标准使用,如果解释清楚,这是可以原谅的。这是《华尔街日报》上一篇关于收入水平的文章中反向使用“百分位数”的示例(大多数百分比反转的情况发生在讨论财富/收入水平的背景下。虽然它比技术上正确的用法要少得多,但它经常发生,你需要仔细检查其含义。)这里是一种后续问题,我在其中寻找这种反向做法的例子。

这只是文档中的一个错字。您对百分位数的理解是正确的。