不要以任何无助于理解的方式使用图表中的空间。需要空间来显示数据!
使用您的科学(工程、医学、社会、商业……)判断以及您的统计判断。(如果您不是客户或客户,请与该领域的人交谈以了解什么是有趣或重要的,最好是那些委托分析的人。)
显示零是的如果与零的比较是问题的核心,或者甚至有一些兴趣,那么轴。
这是三个简单的规则。(不排除他们之间有时会出现一些紧张关系。)
这是一个简单的例子,但所有三点都出现了:您以摄氏度、华氏度甚至开尔文为单位测量患者的体温:任您选择。在什么意义上坚持显示零温度是有帮助的,甚至是合乎逻辑的?重要的,甚至是医学或生理上至关重要的信息,否则将被掩盖。
这是一个演示文稿中的真实故事。一位研究人员正在展示印度各个州和联邦领土的性别比例数据。该图形是一个条形图,所有条形都从零开始。尽管存在一些相当大的差异,但所有条形都接近相同的长度。这是正确的,但有趣的故事是,尽管有相似之处,但区域是不同的,而不是尽管有差异,但它们是相似的。我建议男性和女性之间的平等(1 或 100 女性/100 男性)是一个更自然的参考水平。(我也愿意使用一些整体水平,例如全国平均水平,作为参考。)甚至一些听过这个小故事的统计人员有时也会回答:“不,条形图应始终从零开始。” 在这种情况下,对我来说,这并不比无关紧要的教条更好。
提到条形图表明使用的图表类型也很重要。假设体温为是的轴范围从 35 到 40∘为方便起见,选择 C 以包含所有数据,因此是的轴从 35“开始”。显然,所有从 35 开始的条形图将是数据的不良编码。但这里的问题是图形元素选择不当,而不是轴范围选择不当。
一种常见的绘图,尤其是在某些生物和医学科学中,通过从零开始的粗条显示平均值或其他摘要,并通过细条显示基于标准误差或标准差的间隔,以指示不确定性。那些不赞成的人所称的这种引爆器或炸药情节可能很受欢迎,部分原因是应该始终显示零的格言。最终效果是强调与通常缺乏兴趣或效用的零的比较。
有些人会想显示零,但还要添加一个刻度中断以显示刻度被中断。时尚变了,科技变了。几十年前,当研究人员绘制自己的图表或将任务委托给技术人员时,要求手工完成会更容易。现在图形程序通常不支持比例中断,我认为这是没有损失的。即使他们这样做了,这也是一个繁琐的添加,可能会浪费图形区域的一小部分。
请注意,没有人坚持相同的规则X轴。为什么不?如果您显示上个世纪左右的气候或经济波动,那么告诉您规模应该从 BC/CE 边界或任何其他起点开始是很奇怪的。
除了上面提到的三个之外,自然还有一个适用的第零个规则。
- 无论你做什么,都要非常清楚。一致且信息丰富地标记您的轴。然后相信细心的读者会看到你做了什么。
因此,在这一点上,我非常同意 Edward Tufte,但我不同意 Darrell Huff。
编辑 2016 年 5 月 9 日:
与其尝试在所有图表中始终包含 0 基线,不如使用逻辑且有意义的基线
Cairo, A. 2016。
真实的艺术:用于交流的数据、图表和地图。
加利福尼亚州旧金山:新车手,第 136 页。