饼图的问题

机器算法验证 数据可视化 多类 饼形图
2022-01-23 02:59:17

关于饼图的讨论似乎越来越多。

反对它的主要论据似乎是:

  • 区域被感知的力量小于长度。
  • 饼图的数据点像素比非常低

但是,我认为它们在描绘比例时会有所帮助。我同意在大多数情况下使用表格,但是当您编写业务报告并且刚刚包含数百个表格时,为什么不使用饼图呢?

我很好奇社区对这个话题的看法。欢迎进一步参考。

我包括几个链接:


为了结束这个问题,我决定构建一个饼图与华夫饼图的示例。

在此处输入图像描述

4个回答

我个人对饼图的问题是,虽然它们可能有助于显示如下差异:

在此处输入图像描述

太多人用它来表明: 在此处输入图像描述

我不会说人们对饼图的使用越来越感兴趣或争论不休。它们在网络和所谓的“预测分析”解决方案中随处可见。

我猜你知道 Tufte 的工作(他也讨论了多个饼图的使用),但更有趣的是,威尔金森的图形语法的第二章以“如何制作饼图?”开头。您可能还知道 Cleveland 的点图,甚至是条形图,将传达更精确的信息。这个问题似乎真的源于我们的视觉系统能够处理空间信息的方式。它甚至在 R 软件中被引用;从在线帮助中pie

Cleveland (1985),第 264 页:“可以通过饼图显示的数据始终可以通过点图显示。这意味着可以沿着一个共同的尺度来判断位置,而不是不太准确的角度判断。” 该声明基于克利夫兰和麦吉尔的实证调查以及感性心理学家的调查。

Cleveland, WS (1985)图形数据的元素沃兹沃思:美国加利福尼亚州蒙特雷。

饼图的变体(例如,类似甜甜圈的图表)都会引发相同的问题:我们不擅长评估角度和面积。恕我直言,即使是“corrgram”中使用的那些,如 Friendly, Corrgrams: Exploratory display for correlation matrices , American Statistician (2002) 56:316 中所述,也很难阅读。

然而,在某些时候,我想知道它们是否仍然有用,例如(1)显示两个类很好,但增加类别的数量通常会恶化阅读(尤其是在 % 之间存在严重不平衡的情况下),(2)相对判断是比绝对的更好,即并排显示两个饼图应该有利于更好地了解结果,而不是简单的估计,例如混合所有结果的饼图(例如双向交叉分类表)。顺便说一句,我向 Hadley Wickham 提出了一个类似的问题,Hadley Wickham 好心地向我指出了以下文章:

  1. 斯宾塞一世(2005 年)。没有谦虚的馅饼:统计图表的起源和使用教育与行为统计杂志,30(4),353–368。
  2. Heer, J. 和 Bostock, M. (2010)。众包图形感知:使用 Mechanical Turk 评估可视化设计CHI 2010,2010年 4 月 10-15 日,美国佐治亚州亚特兰大。

总而言之,我认为它们仅适用于粗略地描绘 2 到 3 个类别的分布(我不时使用它们在年龄直方图之上显示样本中男性和女性的分布),但是它们必须伴随着相对频率或计数才能真正提供信息。表格仍然会做得更好,因为您可以添加边距并超越 2 路分类。

最后,还有基于饼图概念的替代显示。我可以想到由 Robert Kosara 在理解饼图中描述的方形饼图或华夫饼图。

饼图和馅饼一样,可能很美味,但没有营养。

除了已经提出的观点之外,一个是旋转饼图会改变对角度大小的感知,就像改变颜色一样。

如果饼图只有几个类别,请制作一个表格。如果它有很多类别,那么切片将太薄而无法看到(更不能准确标记)。

我在我的博客上写过这个

我认为您已经回答了第二个要点的问题。如果您想占用宝贵的房地产,那就这样吧!然而,第一个子弹更重要。使用条形图,观察者需要仅基于 1 个轴来估计相对比例。使用饼图判断至少涉及 2 个轴。一个轴是弯曲的。我认为当饼图中有许多类别,带有图例时,饼图最有效地使用,并且判断比例并不是那么重要。