如何用一个数字表达分布的“不等式”?

机器算法验证 分布 标准差 游戏 幂律 多样性
2022-04-13 16:43:10

我的工作中有一个教育游戏,它挑战玩家以减少人口大国和人口少的州之间不平等的方式重新绘制美国州界。当他们玩游戏时,他们需要获得关于将县从一个州分配到另一个州的效果的实时反馈。

所以我需要某种“平等”的单一参数,它来源于新假设的一组状态中的人口分布。

我考虑过只显示州人口的标准偏差。有没有更好的方法来简洁地表达功率分布?我更喜欢尽可能简单易懂的东西,因为我想吸引广大观众。以下是截至 2010 年人口普查的州人口,以供参考。

在此处输入图像描述

2个回答

也许最著名的衡量标准是基尼指数

R 包ineq(参见此处)实现了Herfindahl和 Rosenbluth 浓度测量(在函数中conc)。

它还在功能上实现了多项不平等指标(包括Gini)ineq——Gini系数、Ricci-Schutz系数(也称为Pietra's measure)、Atkinson's measure、Kolm's measure、Theil's entropy measure、Theil's second measure、变异系数和平方变异系数。

该答案提到了辛普森多样性指数,并从中得出了集中度度量。还有许多其他的多样性指数(以及其他集中度指标)。您可能会注意到与赫芬达尔指数有联系(辛普森多样性指数赫芬达尔,相应的浓度度量是归一化的赫芬达尔。事实上,我只是编辑了另一个答案来指出这一点。)

[例如,在处理计数数据或从计数得出的比例时,还可以定义从卡方拟合优度统计得出的度量(它们可以标准化为 0-1)。对于这样一种措施,请参见此处。]

其中许多要么是合适的,要么可以重新调整以适合作为您想要的事物的度量。

我开发了一种量化“均匀性”的方法,可以让你做你想做的事。它也帮助了其他几个人。

请参阅:https ://math.stackexchange.com/questions/921084/how-to-calculate-peakiness-or-uniformity-in-histogram/921110#921110

基本上,您只是通过用直线连接连续点来计算相关 CDF 的路径长度。