以下描述了我要完成的工作,但有可能一个替代问题陈述可以描述我的目标:
我想要
将以下数字分组,每组内数字的方差不太大,各组平均值之间的差异不太小
将最终获得的分布与“完美”的分布进行比较,看看它与完美的“不同”。
外行人对目标的解释
我正在尝试计算收入分配,并确定每个人口所处的“收入等级”。收入等级应该根据输入数据进行自我调整。
我的目标是最终衡量或计算收入等级之间的差异。我假设会有很多括号,并且想看看每一层“相距”多远。
以下是 20 人样本集的每小时收入样本,总收入为 3587:
Population= 10 pop=2 population=5 population =3
10, 11,13,14,14,14,14,14,15,20, 40,50 ,90,91,92,93,94 999,999,900
如何使用数学概念对数据进行分组、排序和分析,这些数据就像给定人口的收入分配一样?
在计算结束时,我想确定分层收入分配,其中完美的分配看起来像这样
(each person makes $10 more per hour than the previous; total is 3587)
89, 99, 109, 119, 129, 139, 149, 159, 169, 179, 189, 199, 209, 219, 229, 239, 249, 259, 269, 279
或这个:
(evenly distributed groups of people make the same per hour)
(gaps between income groups is consistent and not "too far")
(income total is 3587)
99 99 99 129 129 129 159 159 159 199 199 199 229 229 229 269 269 269
问题
我应该如何分析人口群体,并以一种可以告诉我需要多少才能使其更像上面列出的最后两个模型集的方式来衡量差距?