从分组的人口普查数据计算平均年龄

机器算法验证 意思是
2022-03-08 15:43:56

我希望您能帮助我解决有关从分组人口普查数据中计算平均年龄的问题。如果使用的年龄类别是 [0–4]、[5–9]、[10–14] 和 [15–19] 岁,您将如何计算中点?我最初假设中点是 2、7 等等。

但是,我在一个工作示例中读到,当年龄范围为 0 到 4 岁时,中点应该是 2.5。我假设这与婴儿实际上不是零岁有关,但我不确定为什么中点会是2.5.

有人可以帮忙吗?非常感谢

2个回答

正如@Bernd 指出的那样,2.5 确实是 0 到 4 岁年龄组的中点,等等。但是,在人口分布的两端使用中点会引入偏差。例如,80 - 90 岁组的中点大约是 83 岁,因为这个组中的大多数人都比 90 岁更接近 80。 ,继续阅读。

人口统计学家使用各种单调插值方法进行估计。一个经典的方法是斯普拉格公式这在他们的文献中有很好的描述;有关概述,请参见 Hubert Vaughan,中心多项式插值中的对称性JIA 80,1954 年已发布的这种方法需要等间距的年龄组,但它可以适应可变间距。@Rob Hyndman 是一篇关于单调样条的好论文的合著者(Smith、Hyndman 和 Wood,人口变量的样条插值:单调性问题, J. Pop. Res. 21 #1, 2004)。该论文提到了“海曼滤波器”的 R 代码。它仍然可以在Rob 的网站上找到。

一旦有了插值年龄分布,您就可以根据标准定义计算矩(和任何其他属性)。例如,平均值是通过数值积分年龄相对于分布来估计的。

0-4岁组是指以下年龄区间:,即4岁364天的孩子仍属于该组。因此,让我们计算该范围的中点:0x<5

> ((365+365+365+365+364)/2)/365
[1] 2.49863