我不会说人们对饼图的使用越来越感兴趣或争论不休。它们在网络和所谓的“预测分析”解决方案中随处可见。
我猜你知道 Tufte 的工作(他也讨论了多个饼图的使用),但更有趣的是,威尔金森的图形语法的第二章以“如何制作饼图?”开头。您可能还知道 Cleveland 的点图,甚至是条形图,将传达更精确的信息。这个问题似乎真的源于我们的视觉系统能够处理空间信息的方式。它甚至在 R 软件中被引用;从在线帮助中pie
,
Cleveland (1985),第 264 页:“可以通过饼图显示的数据始终可以通过点图显示。这意味着可以沿着一个共同的尺度来判断位置,而不是不太准确的角度判断。” 该声明基于克利夫兰和麦吉尔的实证调查以及感性心理学家的调查。
Cleveland, WS (1985)图形数据的元素。沃兹沃思:美国加利福尼亚州蒙特雷。
饼图的变体(例如,类似甜甜圈的图表)都会引发相同的问题:我们不擅长评估角度和面积。恕我直言,即使是“corrgram”中使用的那些,如 Friendly, Corrgrams: Exploratory display for correlation matrices , American Statistician (2002) 56:316 中所述,也很难阅读。
然而,在某些时候,我想知道它们是否仍然有用,例如(1)显示两个类很好,但增加类别的数量通常会恶化阅读(尤其是在 % 之间存在严重不平衡的情况下),(2)相对判断是比绝对的更好,即并排显示两个饼图应该有利于更好地了解结果,而不是简单的估计,例如混合所有结果的饼图(例如双向交叉分类表)。顺便说一句,我向 Hadley Wickham 提出了一个类似的问题,Hadley Wickham 好心地向我指出了以下文章:
- 斯宾塞一世(2005 年)。没有谦虚的馅饼:统计图表的起源和使用。教育与行为统计杂志,30(4),353–368。
- Heer, J. 和 Bostock, M. (2010)。众包图形感知:使用 Mechanical Turk 评估可视化设计。CHI 2010,2010年 4 月 10-15 日,美国佐治亚州亚特兰大。
总而言之,我认为它们仅适用于粗略地描绘 2 到 3 个类别的分布(我不时使用它们在年龄直方图之上显示样本中男性和女性的分布),但是它们必须伴随着相对频率或计数才能真正提供信息。表格仍然会做得更好,因为您可以添加边距并超越 2 路分类。
最后,还有基于饼图概念的替代显示。我可以想到由 Robert Kosara 在理解饼图中描述的方形饼图或华夫饼图。