学习使用(/创建)动态(/交互式)统计可视化的资源

机器算法验证 数据可视化 交互式可视化
2022-03-12 17:30:44

我想了解更多有关交互式数据可视化(缩放、指向、刷亮、点映射等)的知识。我会欢迎任何:

  1. 关于如何使用这些方法进行统计探索的教程/指南/书籍(?)/视频。
  2. 好的/有趣的交互式数据包的指针(在 R 中,以及它之外)

只是开始滚动,我知道在 R 中有多种方式可以获得交互式可视化,如rggobi、新的googleViz R 包动画包等。但如果还有其他值得探索的软件包(提供 R 没有的东西),我会很高兴了解它们(如 jmp、mathlab、spss、sas、excel 等)。

ps:这是第一个使用标签“interactive-visualization”的问题

4个回答

除了Protovis (HTML+JS) 或Mayavi (Python),我推荐Processing

一种开源编程语言和环境,适用于想要创建图像、动画和交互的人。最初开发用作软件速写本,并在视觉环境中教授计算机编程的基础知识。

http://www.openprocessing.org/上有很多开源脚本,还有很多相关的书籍处理处理和数据可视化。

我知道有一个提供 R 接口的项目rprocessing,但我不知道它是怎么回事。还有一个与 clojure/incanter 的接口(参见例如,使用 Clojure 和 Incanter 创建处理可视化)。

有很多在线资源,其中有斯坦福课堂笔记,例如CS448B,或7 篇你可能不想公开承认你不知道的经典基础 Vis 论文

一些更多的包可以添加到 Chl 的 Processing 建议中,以创建交互式可视化。所有这些都是基于 javascript 的,并且可以在浏览器中运行,因此可以用于发布以及您自己的分析:

  • D3.js是 Protovis 的继任者。它的强大之处在于您可以更好地控制创建的对象(它们是正确的 DOM 对象,即您可以使用 javascript 完全控制它们),但有些人更喜欢 Protovis 以简化操作。良好的技术 D3 与 Protovis 讨论在这里
  • Raphael.js是高度定制的大众市场网络交互性的一个不错的选择,因为它既是面向未来的(无闪存),也适用于像 IE6 一样古老的浏览器(我所知道的唯一不适用的是旧版本的安卓浏览器)。与 D3 一样,一切都是可定位的 DOM 对象,并且它具有良好的内置 api 控件用于动画和交互性。它没有提供任何针对可视化的开箱即用:它是一个非常强大且灵活的空白板,是设计自定义可视化的绝佳选择,但不适用于您自己的初始探索性​​分析。首先熟悉您的数据。
  • gRaphael.js是 Raphael 的标准图表(条形图、折线图等)。它是基本的,但可以工作并且可以构建 - 如果您正在构建自己的套件,这可能是一个有用的成分。

关于您关于学习的其他问题,对于一般原则,信息仪表板设计值得一提,如果您想要为您的数据制作一系列通用交互式标准工具。

交互式可视化处于统计数据和交互性设计之间:所以这方面的书籍可能会有用。我对许多交互设计教科书没有任何亲身经历,但我是通用设计原则的忠实粉丝。这可能对您的需求有点过分,但请考虑查看其出色的分类内容页面中的可用性列并阅读列出的章节(渐进式披露、信噪比等)。

此外,对于任何刚接触编程的人来说,Programming Interactivity是增强技术技能的一个很好的起点(它还包括一个关于处理的重要章节)。

但是要知道什么是可行的,什么是可能的,你不能在实践中学习一个好的开始可能是考虑跟踪和分析大牌的大价格标签通用交互式可视化包,如tableaujmp,并思考为什么他们的功能是这样设计的。

除了 Processing,查看基于 Python 的 Nodebox (1, 2, OpenGL),它的灵感来自 Processing:

Nodebox 1 仅适用于 Mac,而 Nodebox 2 和 OpenGL 版本是跨平台的。

Python 有大量可以导入 Nodebox 的数据处理库,例如 scipy.org

作为现有答案的另一种方法,在我发布第一个长列表后不久,WEAVE出现了:一个开源的专用数据可视化套件。这是关于领先数据与博客流动数据的关于 WEAVE 的简短文章

根据您在流程中所处的位置,采用不同的数据可视化方法是明智的。您越早 - 您的数据越原始和未经探索 - 您就越有可能从 WEAVE 等预构建、灵活、通用的套件以及 Tableau 和 JMP 等闭源商业对应套件中受益 - 您可以快速尝试并轻松地了解数据并找出采取哪些攻击方式以充分利用数据。

随着您发现更多有关数据的信息,您的重点可能会转向交流或“引导式探索”——根据您现在在数据中发现的注意事项、细微差别和感兴趣的领域设计的更加定制的探索性数据可视化。这就是上面列出的程序化矢量绘图工具等空白产品的用武之地。