这个图表叫什么?

机器算法验证 数据可视化 条形图 饼形图
2022-04-07 17:16:49

K图

我设计这个图表是为了结合条形图和饼图提供的好处。其最接近的已知替代方案是帕累托图有了这个(新的?)图表,折线图被瀑布图取代,主要原因有两个:

  1. 它更好地反映了水平轴的离散性。
  2. 它使可视化每个值对整体的贡献变得更容易。

此外,条形图被级别图取代,以减少级别(彩色水平刻度)和条形之间的视觉冲突的影响。

与帕累托图非常相似,此图表使用两个垂直轴,一个用于值本身,一个用于值的总和。因此,这两个轴是一致的,但使用不同的比例。这篇文章可以更详细地解释它的起源

我的问题如下:这张图表是否有任何现有技术,如果有,它叫什么?现在,我称它为K 图表K,因为当值按降序排序并且右侧显示“全部”条时,它看起来像大写字母。

与饼图相比的好处:

  • 标签和值的显示大大简化,空间效率更高。
  • 水平轴可以是纪元(时间与纪元,如日期)。
  • 布局可以旋转 90°(例如,为了支持纵向输出)。
  • 有一个明确的阅读起点(左或右取决于语言)。
  • 有一个自然的地方可以显示值的总和。
  • 有一个自然的地方可以显示增量或增长率。
  • 颜色的使用是完全可选的(非常便于访问)。
  • 水平维度永远不会与方向变量混淆。

参考:

  1. 原理数据(统计变量的统一类型)。
  2. Principia Pictura(统一的图表语法)。

附录:

K图无非是Level图和Waterfall图的叠加:

水平图

瀑布图

奖金问题:

我们可以将任何含义归因于 K 图表的两条腿相交的点吗?如果我们有一个连续的概率分布,这将是解决方案i到以下等式,其中f(x)是一个单调递减函数,并且α是两个轴之间的比例因子:

0if(x)dx=αf(i)

当然,我们可以表达α和---关联f(x)

α=0Max(x)f(x)dxf(0)

因此,我们要求解的方程是:

0if(x)dx=f(i)0Max(x)f(x)dxf(0)

这是我能接受的范围...

2个回答

Leland Wilkinson (2006)的《Revising the Pareto Chart》在 Pareto 图上提供了一些有趣的变化,但没有一个类似于 K 图。出于参考目的,以下是同一数据集的单轴帕累托图的样子:

单轴排列图

和一个双轴帕累托图:

双轴帕累托图

我发现 K 图比传统帕累托图的任何一个版本都更容易阅读。

此外,正如 Leland Wilkinson 正确地指出的那样:

“[...],用插值线元素表示累积频率没有理论上的理由。由于不能假设类别在比例上等距分布,因此我们没有理由解释整体斜率或分段斜率这条线。出于类似的原因,我们没有理由在这条线中寻找“扭结”来检测断点或问题类别的子组。”

这可能是传统帕累托图最大的问题,而这个问题是通过用水平图代替折线图来解决的。

该图表是可以称为单变量组合图表的特殊情况。