为什么人口统计学家要给出每 100,000 人的比率?

机器算法验证 人口学 单位
2022-03-16 14:50:11

以每年 100,000 人口的形式给出人口统计数据似乎很普遍。例如,自杀率、凶杀率、残疾调整生命年,不胜枚举。为什么?

如果我们谈论化学,百万分之几 (ppm) 很常见。为什么计算人数的行为从根本上有所不同。100,000 这个数字在 SI 系统中没有根据,据我所知,它根本没有经验基础,除了与百分比的弱关系。每 100,000 人的计数可以解释为毫百分比,m%。我想这可能会引起一些抱怨。

这是历史文物吗?或者有什么理由来捍卫这个单位?

4个回答

一项小型研究首先表明,人口统计学家(以及其他人,例如报告人口事件发生率的流行病学家)不会“普遍”使用 100,000 作为分母。事实上,谷歌搜索“demography 100000”或相关搜索似乎会找到与 100,000 一样多的使用 1000 作为分母的文档。一个例子是人口参考局的人口统计术语表,它一直使用 1000。

环顾早期流行病学家和人口统计学家的著作表明,早期的流行病学家(如约翰·格朗特和威廉·佩蒂,1662 年早期伦敦死亡率法案的撰稿人)甚至没有标准化他们的统计数据:他们报告了特定行政单位内的原始计数(例如伦敦市)在给定的时间段内(例如一年或七年)。

开创性的流行病学家John Snow (1853) 制作了标准化为 100,000 的表格,但讨论了每 10,000 人的比率。 这表明表中的分母是根据可用的有效数字的数量选择的,并进行了调整以使所有条目都具有完整性。

这样的约定在数学表中很常见,至少可以追溯到约翰纳皮尔的对数书范围内的值的七位数精度(十进制表示法显然是最近才出现的,以至于他觉得有义务在书中解释他的表示法!)因此人们会期望选择典型的分母来反映报告数据的精度并避免使用小数。[0,1]

John Tukey的经典文本 EDA (1977)提供了一个现代示例,该示例一致地使用 10 次方重新缩放以在数据集中实现可管理的整数值。他强调,数据分析师应该随意重新缩放(更一般地说,非线性重新表达)数据,以使它们更适合分析和更易于管理。

因此,我怀疑这种推测,无论多么自然和吸引人,100,000 的分母在历史上起源于任何特定的人类规模,例如“中小型城市”(在 20 世纪之前,无论如何,这个城市的人口应该少于 10,000 人)少于 100,000)。

我似乎记得,在几十年前的人口地理学课程中,我们的讲师(现为普渡大学的 Brigitte Waldorf 教授)说过[大意],我们表达了每人发生的次数(例如,死亡、出生) 100,000,因为即使只有 30 或 50 次出现,我们也不必求助于讨厌的百分比。直观地说,对于大多数人(尽管可能不是这个受人尊敬的论坛的读者)来说,在上水獭的底部,2010 年 35 至 39 岁男性的蛇咬伤死亡率为每 100,000 名居民中有 13 人死于蛇咬伤。它只是让比较不同地点和群组的比率变得容易(尽管百分比也是如此)。

虽然我不是人口统计学家,但我从未听过任何人提到中等城市的论点,尽管这听起来很合理。只是在与地理学家和相关社会科学家打交道的大约 20 年中,作为本科生、研究生和现在的教员,我从未听说过有关城市规模的具体解释。到目前为止。

通常,我们试图将信息传达给真实的人,因此使用对人们有意义的数字很有用。10万人是一个中小城市的规模,不难想象。

相对频率通常用于通知普通人群而不是专家,它们对于这个用例有一些优势:

  • 相对频率总是允许整数而不是分数,如果感兴趣的变量仅在整数格式中有意义(例如 100 个人中的 0.5 或 100 出生中的 0.3 没有帮助),这很有用。如果发生率非常低(例如百万分之一),则百分比也不理想(0.0001%)
  • 相对频率可能更容易想象:十分之一可能让我们想起我们认识的 10 个人;10% 比较抽象。正如 Greg Snow 所指出的,相对频率与现实世界有关。如果我的城市有 100 000 人,85/100 000 更容易掌握。
  • 实际上还有关于这一点的科学理论,即“频率格式假说”:“频率格式假设是这样一种想法,即当以频率格式而不是数字或概率格式呈现时,大脑可以更好地理解和处理信息。” (来自维基百科)
  • 最后,有时给出的百分比没有参考等级(什么的百分比?)