如何可视化范围(最小/中/最大)?

机器算法验证 数据可视化 范围
2022-04-11 17:04:22

我正在寻找一种视觉上引人注目但立即可以理解的方式来可视化一系列数据(最小值、中值、最大值)

注意事项:

  1. 该方法应该为各种各样的人所理解
  2. 理想情况下,将允许与另一组数据进行比较
  3. 理想情况下,可以正常工作,或者在高 N 和低 N 情况下都可以

您能想到哪些新方法来可视化此类数据

这里有些例子:

示例 1:以下是 Glassdoor 上显示一系列数据和比较的方式:

Glassdoor 上工资范围的可视化

示例 2:这是在 Indeed 上显示一系列数据和比较的方式:

Indeed.com 上工资范围的可视化

示例 3:这是来自 CareerBuilder 的另一个非常相似的示例:

在此处输入图像描述

示例 4:以及 Trucar 对一系列数据(许多用户支付的汽车价格)的可视化。
这可能会推动普通观众的理解范围。

Trucar 上的汽车价格分布可视化

1个回答

如果类别之间有不同的最小阈值,示例 1 似乎很好。

正如 Glen_b 和 whuber 所指出的,似乎 2 号和 3 号示例并未显示您的类别范围,而仅显示了水平条顶部的一个唯一统计数据(可能是中位数或最大值)。

示例编号 4 有点奇怪,因为钟形曲线不代表条形的分布(例如,蓝色光点“平均支付”是钟形曲线的平均值,而不是条形中显示的数量的平均值)。对我来说,这不是“视觉上引人注目但立即可以理解的”。

当您要求另一种选择时,我建议使用boxplot,它显示:

  • 异常值(点),
  • 不考虑异常值(胡须末端) 1的最小值和最大值
  • 第一和第三四分位数(盒子的边缘),以及
  • 中位数(框内的水平条)。

每个盒子都是一个类别。从具有最大中位数的类别开始,从左到右对框进行排序。

示例编号 1 更易于理解,因此它取决于箱线图是否真的有帮助。

1:请参阅 whuber 的评论以进行澄清。