我正在寻找一些有关创建有效图形/数据可视化的参考资料。
我找到了一堆书,展示了如何使用某些工具(如 R/ggplot vs python/pandas)创建数据可视化,但这并不是我真正想要的。我正在寻找一个参考来解释关于统计/数学的不同类型的图表。我想要更多的理论而不是过程。
我想知道不同类型的图表以及如何使用它们。什么都有帮助!
我正在寻找一些有关创建有效图形/数据可视化的参考资料。
我找到了一堆书,展示了如何使用某些工具(如 R/ggplot vs python/pandas)创建数据可视化,但这并不是我真正想要的。我正在寻找一个参考来解释关于统计/数学的不同类型的图表。我想要更多的理论而不是过程。
我想知道不同类型的图表以及如何使用它们。什么都有帮助!
我认为威廉·克利夫兰的作品会更接近你想要的塔夫特的作品。克利夫兰写了两本书:
尤其是第一本书,可能就是你想要的。以下是出版商的描述:
可视化数据是关于提供对数据结构的深入洞察的可视化工具。有图形工具,例如 coplots、多路点图和等计数算法。有一些拟合工具,例如 loess 和 bisquare,可以将方程、非参数曲线和非参数曲面拟合到数据。但这本书不仅仅是有用工具的概要。它传达了一种数据分析策略,强调使用可视化来彻底研究数据结构并检查适合数据的统计模型的有效性。工具和策略的结果是您可以从数据中学到的东西大大增加。这本书通过重新分析科学文献中的许多数据集来证明这一点,揭示了缺失的影响和适合数据的不适当模型。
一本更具理论性的书是Leland Wilkinson的 The Grammar of Graphics。说明:
本书是为统计学家、计算机科学家、地理学家、研究人员和其他对数据可视化感兴趣的人编写的。它为制作科学期刊、报纸、统计包和数据可视化系统中的几乎所有定量图形提供了独特的基础。虽然这项工作的实际成果是几个可视化软件库,但本书侧重于从数据生成定量图形所涉及的深层结构。饼图、条形图、散点图、函数图、地图、马赛克、和雷达图?那些对理论和数学基础不太感兴趣的人仍然可以通过检查它可以产生的众多且通常是独特的彩色图形来了解系统的丰富性和结构。第二版几乎是原版的两倍,有六个新章节和大量修改。许多添加的材料使本书适用于可视化和统计图形的调查课程。
这本书理论性很强。
看看 Ed Tufte 写的系列书。维基百科在文章https://en.wikipedia.org/wiki/Edward_Tufte中讨论了它们。
定量信息的视觉展示。1983;2001 年第二版。康涅狄格州柴郡:图形出版社
设想信息。1990. 康涅狄格州柴郡:图形出版社
视觉解释:图像和数量,证据和叙事图形出版社。1997. 康涅狄格州柴郡:图形出版社
美丽的证据。2006. 康涅狄格州柴郡:图形出版社
冒着被钉死在十字架上的风险,如果你刚刚开始,我建议不要使用 Tufte、Wilkinson、Cleveland 等以及所有其他经典作品。
原因是您提出的以下目标(强调):
我正在寻找一些有关创建有效图形/数据可视化的参考资料。
因此,即使您不明确想要依赖语言的书籍/教程,您也希望应用您的知识,而不是在咖啡上进行抽象的理论练习。从我所说的经典开始就像阅读莎士比亚,因为你希望你的语言更有说服力。书中的讨论非常适合为理解有效的数据可视化奠定基础;但考虑到迄今为止的技术进步——这些书对培养应用思维没有太大帮助(图形语法——威尔金森是一个轻微的例外,因为与ggplot2但在这种情况下,我建议阅读哈德利威克姆的作品,而不是包作者)。
您可以查看的一些很好的资源是FlowingData (Nathan Yau)、Perceptual Edge (Stephen Few) 和Storytelling with Data (Cole Knaflic) 以及博客作者的书籍。原因如下:
很遗憾Aaron Koblin没有出版任何关于他对大数据可视化的独特见解的书籍。
我并不否认 Tufte、Cleveland 和 Wilkinson 的工作有多么有用,但是在经历了其中的一些之后,在现代数据可视化工具方面仍然只略胜一筹,Stephen Few 的“Show me the Numbers”就像一个电灯开关。
这在很大程度上取决于您喜欢的语言。由于我不经常使用 Python 进行数据可视化,我只能向您推荐与 R 中的数据可视化相关的书籍。写完这篇文章后,我重新阅读了您的问题和 Nr。1,编号。2也许Nr。4可能是最理论的。虽然 Nr。6 还解释了它专门用于可视化无监督机器学习技术的理论方面。
作者 Paul Murrell 在开发 R 语言的图形方面发挥了重要作用。他开发了“图形语法”概念,这是 ggplot2 库的基础概念。这本书相当先进,虽然你不需要很多必要的和相当理论的知识。对于真正想了解 R 中数据可视化概念的人来说,这是一本最好的书,但我不建议初学者阅读。
是交互式数据可视化的必备工具。各种 JavaScript 库都被翻译成 R 并适应了 R。您可以在 RShiny、Markdown(呈现为 HTML)或控制台中包含大多数小部件。我最喜欢的 HTML 小部件是
数据表(由 RStudio 的 Yuhui Xe 编写,他还编写了 knitR 和 bookdown 包。多产用于显示表格))
这本书对初学者比较友好。它的示例主要显示在 ggplot2 中。当我开始在 RI 中学习高级数据可视化技术时,主要使用这个和官方 ggplot2 网站。
是学习 ggplot2 的最佳起点,但如果您不愿意充满激情并且没有太多时间,它可能会显得压倒性地出现。ggplot2 很棒,但它的学习曲线可能很陡峭,例如你不能在行首写“+”。还解释了所有理论概念。
Shiny 是使用 R 构建应用程序的最常用的 R 库。它可以被 Tableau 或 Qlickview 等 BI 工具替代。shinyjs是 Shiny 的一个很好的扩展,它结合了 Shiny 和 javascript,但你也可以自己包含 HTML、CSS 和 JavaScript。
这本书与精美图形指南 (nr.3)的作者相同。这是一本用于可视化无监督机器学习技术,尤其是聚类的专业书籍。
7.简单的教程
万一你刚开始想象,我有点不知所措。