前半个百分点的“-iles”术语

机器算法验证 术语 分位数
2022-01-20 19:17:44

前 25% 是前四分之一。前 10% 是最高的十分位数。前 1% 是最高百分位数。

前 0.5%(即 1-in-200)是否有等价物?

4个回答

从历史上看,直到现在,上四分位数或第三四分位数(例如)是仅超过 25% 的值(我只看到过非正式使用“top”来表示这个意思。)

通过扩展,上四分位数或第三四分位数与最大值之间的区间或区间通常也称为上四分位数,有时也称为第四四分位数。更一般地说,个断点定义了组。“季度”一词也可用,也许更可取。kk+1

有些人可能会对术语的这种松散性持怀疑态度,并且在有问题时更喜欢(甚至坚持)诸如 bin 或 interval 之类的术语。更积极的是,消除两种相关意义的歧义通常并不太难。如果有人谈论课程表现或 BMI 或其他方面排名前四分之一的人,那么目的很明确。

类似的评论适用于十分位数和百分位数。其他不同用途的术语是三分位数(罕见?)、五分位数(常见)、六分位数(罕见?)和八分位数(不常见但并不罕见)。这里的资格是基于我随意的阅读和记忆。

拉丁语不再像最热心的支持者所希望的那样熟悉,而且这些术语对许多人来说都具有挑战性。更积极的是,作为标准术语的分位数似乎越来越趋同,只是希望看到数字定义是明确的。因此,我希望看到对 5、1、0.5 % 点或分位数的引用,类似的上 % 点或分位数。在实践中,对于大多数此类值或它们定义的箱,我认为没有使用,并且原则上认为没有必要使用拉丁语(或希腊语或任何其他语言)术语。具体来说,任何知道如何解释“前半个百分点”的人都可能会发现“超过 99.5% 点”更易于使用。5,1,0.595,99,99.5

编辑 2016 年 10 月 5 日

Aronson (2001) 记录了分位数各种术语的首次使用。此处的列表包括 2016 年 10 月 5 日在牛津英语词典和www.jstor.org中搜索的一些较早日期。这些日期指的是术语的最早引用及其统计含义,而不是其他含义。一般术语分位数本身通常归因于 Kendall (1940),但可以在 Fisher 和 Yates (1938) 中找到。

English ordinal   Statistical term  Earliest citation 2016+ additions 
                                        (Aronson)          (Cox) 

  Third              Tertile             1931              1911
                     Tercile             1942 
                    
  Fourth             Quartile            1879          

  Fifth              Quintile            1951              1910 

  Sixth              Sextile             1920 

  Seventh            Septile             1993              1981 

  Eighth             Octile              1879 

  Ninth              Nonile              1968 

  Tenth              Decile              1881 
                     Decentile (***)     1988

  Sixteenth          Suboctile           1880
                     Hexadecile (*)                        2001  

  Twentieth          Vigintile           1936
                     Ventile (**) 

  Thirtieth          Trentile                              1958

  Fortieth           Quadragintile       1976 

  Hundredth          Percentile          1885 
                     Centile             1902              1894 

  Thousandth         Permille            1904 

Aronson, JK 2001。弗朗西斯·高尔顿和分位数术语的发明。 临床流行病学杂志54:1191-1194。

Fisher, RA 和 Yates, F. 1938。 生物、农业和医学研究统计表爱丁堡:奥利弗和博伊德。

Kendall, MG 1940。注意大样本的分位数分布。 补充皇家统计学会杂志7:83-85。

编辑 2016 年 12 月 22 日 以上历史信息现在写在 Cox, NJ 2016 中。字母值作为选定的分位数。Stata 期刊16:1058-1071 http://www.stata-journal.com/article.html?article=st0465

编辑 2017 年 6 月 20 日添加了“trentile”参考。Slonim, MJ 1958。天气预报评估的三分位偏差法。美国统计协会杂志53:398-407。http://www.jstor.org/stable/2281863

编辑 2019 年 8 月 7 日三分位数的另一个参考文献是 Panofsky, HA 和 Brier, GW 1958。一些气象统计应用。宾夕法尼亚州大学公园:宾夕法尼亚州立大学矿产工业学院。它们指的是在第二次世界大战中的使用。

编辑 2021 年 1 月 9 日 四分位、六分位和八分位在塞缪尔·约翰逊字典(1755)的第一版中,但具有天文意义。其他条款都不是。

编辑 2021 年 1 月 29 日 (*) Hexadecile 记录于 2001 年(链接礼貌@whuber)

编辑 2021 年 2 月 5 日(**)从这个意义上说,最早使用 ventile 很难在完全不同的含义中找到。

编辑 2021 年 9 月 25 日 (***) 添加了分位数(不在 OED 中,一些 JSTOR 热门歌曲)。

这些段的通用术语是“分位数”,即前 0.005 分位数是您要查找的数据段。分位数在 [0, 1] 的范围内。对于显着/常用的分位数(三分位数、四分位数、百分位数等),我们有单独的名称,但我们没有其他名称。从技术上讲,我想如果你知道拉丁语,你可以为它们取一个名字,比如“bicentile”,但没有人会理解它,你最终还是会解释它。

它被称为上半百分比或上半百分比。谷歌

“前半个百分点”

或者

“上半个百分点”

找到在实践中使用的这些术语,最常见于经济学中。