支持 Tufte 风格可视化的实验证据?

机器算法验证 数据可视化
2022-01-16 18:49:53

问:是否存在实验证据支持 Tufte 风格的、极简主义的、用数据说话的可视化,而不是像Nigel Holmes那样的图表垃圾可视化?

我在这里问如何将图表垃圾添加到 R 图中,响应者向我扔了一大笔蛇。所以,当然,肯定有一些实验证据,我不知道,支持他们的反图表垃圾立场——比“塔夫特这么说”更多的证据。对?

如果存在这样的证据,它将与我们关于人类、他们的记忆回忆和模式识别的许多心理学研究相矛盾。所以我肯定会很高兴读到它。

一个小轶事:在一次会议上,我问 Edward Tufte,他如何看待实验证据发现垃圾动画和视频可以提高人类的理解和记忆回忆[参见大脑规则中引用的研究]他的回答是:“不要相信他们。” 科学方法就这么多!

PS当然,我在这里有点需要人。我拥有 Tufte 的所有书籍,并认为他的作品令人难以置信。我只是认为他的支持者夸大了他的一些论点。

注意:这是我在 StackOverflow 上提出的问题的重新发布版主关闭了它,因为它不是特定于编程的。CrossValidated 可能是一个更好的家。

更新:在我原来的问题帖子的评论部分有一些有用的链接——即,指向钱伯斯、克利夫兰和斯坦福大学 datavis 小组的工作。

更新:这个问题涉及类似的主题。

4个回答

文献浩如烟海。 实验证据丰富但不完整。有关侧重于心理和符号学研究的介绍,请参阅 Alan M. MacEachren,地图工作原理(1995;2004 平装本)。直接跳到第 9 章(接近尾声),然后向后阅读任何你感兴趣的初步材料。参考书目很广泛(超过 400 份文件),但有点长。尽管书名暗示了对制图学的关注,但本书的大部分内容都与人类如何从图形信息中创造意义和解释图形信息有关。

不要期望从任何数量的此类研究中得到明确的答案。请记住,Tufte、Cleveland 和其他人主要专注于创建能够(最重要的是)准确、有洞察力地交流和解释数据的图形。其他图形艺术家和研究人员还有其他目标,例如影响人们、创建有效的宣传、简化复杂的数据集以及在图形媒体中表达他们的艺术感受。这些几乎与第一组目标截然相反,您会从中找到截然不同的方法和建议。

鉴于此,我认为对克利夫兰研究的回顾应该足以令人信服,塔夫特的许多设计建议都有很好的实验理由。这些包括他使用谎言因子、数据墨水比、小倍数和图表垃圾来批判性地评估和设计统计图形。

这里有一些;

  • Cleveland and McGill (1984, JASA) 图形感知:理论、实验和图形方法开发的应用
  • Cleveland 和 McGill (1987, JRSSA) 图形感知:数据图形显示中定量信息的视觉解码
  • Lewandowsky 和 ​​Spence (1989) 在散点图中区分地层
  • Spence 和 Lewandowsky (1991) 显示比例和百分比
  • Spence Kutlesa 和 Rose (1999) 在空间显示中使用颜色编码数量

向 Google 索取完整的参考资料

值得记住的是,信息可视化并不是与所有其他形式的视觉交流隔绝的孤岛。如果你想根据基于证据的原则来创作作品,我认为最好看看证据最强的地方。

我阅读了有关数据可视化技术的具体研究,以及认知科学和一般设计研究中的一般研究,我发现思考如何将更强大、更彻底的一般研究应用于每个简报和使用的每个元素通常更有效并且比试图应用狭隘应用的特定领域研究更有用,因为这些研究经常受到小样本、研究技术薄弱、调查范围狭窄和/或根深蒂固的假设的影响。

我推荐两本优秀的书作为入门,一本以科学为出发点,一本以一般原理为出发点,有据可查:

  • 史蒂夫帕尔默的视觉科学它是一头野兽,作为一名学生,我有几次差点把自己背伤了,我傻到把它放在背包里,但它也可能是我见过的最好的科学教科书,也是脆的一个很好的例子视觉和语言交流本身。我最近通过它标记了与我的可视化和信息设计工作直接相关的内容的章节,希望只标记一些:我最终标记了除一个之外的每一章。
  • Rockport Press 的《通用设计原则》一本非常雄心勃勃且非常有用的书,它将认知科学研究与来自所有设计分支的案例研究和示例压缩成一系列非常清晰和直截了当的双页跨页,每页都涵盖了一个既定的、基于证据的和实用的原则,实用的建议、工作示例和进一步阅读的建议。非常刺激,只要您将其视为具有建议用途的工具列表而不是规则列表即可。

唯一的缺点是,这种方法需要更多思考才能了解这些原则如何适用。如果您正在寻找任意规则的列表,就像数据与社区中的许多规则一样,我会说没有并且永远不会,除非人们做出大量不合理的假设和概括,或者编造一些事情. 更高质量的应用研究是有用的,但它有助于拥有一个可以插入的坚实框架。

Tufte 的大部分一般原则,如数据墨水和图表垃圾,都可以追溯到可靠的一般原则,如信噪比、图形接地、衰减等——但在成为特定领域和规范的道路上,它们与关于你的目标和受众的大量假设和概括相结合,将它们变成了生硬的工具。如果您退后一步,考虑上下文并从潜在的核心原则和每个案例的特定特征出发,应用研究中的许多明显矛盾和争论根本不是矛盾。

在制图领域有一项非常好的研究(Hegarty 等人(2009 年):Naïve 制图:关于显示配置的直觉如何影响性能。发表于:Cartographica The International Journal for Geographic Information and Geovisualization 44(3):171 -186)

特别有趣的是,作者研究了一项比简单读取条形图值更复杂的任务:专家和新手用户必须从气象图确定风速和压力梯度。两组参与者都直观地更喜欢一张添加了浮雕阴影和州边界的地图(Tufte 可能会称之为“chartjunk”,因为它与任务无关)而不是一张更简约的地图,只显示背景中的美国轮廓。但即使个人对图表垃圾有如此强烈的偏好,参与者实际上使用这张地图的表现要差得多,无论是在准确性还是响应时间方面。

我发现这项研究特别有趣的是,复杂的用例(如气象学)对于我们设计师/制图师/数据分析师来说确实很常见。很多时候,它不仅仅是一些小条形图,而是我们需要设计整个仪表板、专题地图、桑基图……减少图表垃圾确实可以在很多时候改善你的可视化。