我正在制作数据可视化。每个数据由一个正方形表示。为了使基础数据直观易读,每个正方形边的长度或每个正方形的面积是否应该与其所代表的基准成正比?
正方形的面积或长度是否应该与正在可视化的数据成比例?
如果你,创作者,不确定,读者怎么知道它是什么?
简短回答:该值应与页面上的颜色量 1:1 相关联。所以在你的例子中,它应该是区域。但不仅如此:您还需要避免可能使读者错误阅读的误导性提示,并且您需要知道为什么使用面积而不是长度(例如条形图),因为它有真正的优点和缺点。
首先,当变量实际上只与一侧的长度相关时,永远不要同时改变形状的长度和宽度(即面积)。如果 X 是 Y 的两倍,但 Y 在页面上的颜色是 Y 的四倍,那么您就是在误导您的读者。这种扭曲有时被称为“谎言因素”,通常被认为是故意误导和夸大差异。
如果您使用面积作为衡量标准,我强烈建议:
知道你为什么使用 area。通过使用面积而不是像长度这样的线性尺寸,您可以:
- 牺牲在数学上清楚地看到差异的能力(你不能轻易地说“看,那是另一个的两倍”)
- 邀请您的读者以直观的日常非数字方式查看它,例如人们比较商店中馅饼的大小。不那么复杂,但更直接。更多的肠子,更少的头。
- 非常相似的数字之间的微小差异几乎不可见。
- 当一个变量比另一个小很多倍时,非常小的变量不会像在条形图中那样消失,这可以使布局更加灵活。
考虑使用圆形来表示区域,而不是正方形,居中对齐:
- 圈,因为它不会引起与条形图和类似的混淆。高度和宽度不太突出:看起来不像是在邀请基于高度或宽度的比较。
- 居中对齐,因为它不会邀请人们比较身高
例如,在上面,标有“5”的正方形很难不看到标有“10”的正方形高度的四分之三,因此它可能具有误导性。
这些圈子不会邀请这种比较:它更像是一种直觉,即“那个 blob 比下一个 blob 大得多”。
从用户测试到小规模研究(稍后将尝试寻找一些示例),有各种证据表明这种基于区域的直观比较可能更具吸引力,可以降低参与度较低的受众的进入门槛,并且可以帮助读者将注意力集中在主题上,而不是数字的冷冰冰的细节上。但这是以妨碍更注重数字的分析为代价的。
不要出于审美原因在一维(长度或距离)和二维(面积)之间进行选择:根据您的受众和信息在它们之间进行选择。
哪个更适合交流:“那更大”级别的即时直觉比较,还是“那大约是另一个级别的 80%”级别的更多考虑数字比较?
还是有实际原因需要使用区域?
然后,当您出于实际原因选择时,请应用美学。
我们在判断区域差异方面不如在长度上那么好。我们使用长度作为代理,因此倾向于低估区域的差异。
出于这个原因,实际上面积是另一个圆的 2 倍的圆显得太小,因为我们的大脑正在关联它们的半径,而半径相差 1.4 倍。
有一些有趣的尝试来协调这种现象,例如R 中的比例符号映射,它提出了符号的感知缩放,以更接近于我们判断长度和区域的方式。
这是本文的图 2
我个人对此没有任何经验,如果需要定量判断,请避免使用区域。
一个有趣的切线是对体积和长度的感知之间的关系。我们如何看待这些的差异更加显着。这可以在这个明星大小比较的视频中得到说明。
当你到达最大的恒星时,它大约是太阳直径的 1,700 倍,你会觉得它比 1,700 倍大得多。
如需更系统地了解我们在感知区域和长度差异方面的错误,请参阅Jeffrey Heer 和 Michael Bostock 的众包图形感知:使用 Mechanical Turk 评估可视化设计。
在我看来,区域(D),而不是每一侧(E)。
如果您使用长度为 2 的边,则面积将是该值的 4 倍,并且您将得到一个非常重叠的图形。(五)
当你有一个正常的条形图 (A) 时,数据是线性的,条形图的 with 只是为了美观。(乙)
在这些情况下,该区域再次代表数据,因为条形的与相同。您可以有一个 3D 条,但条的体积仍然是代表数据的量 (C)