在准备即将发表的演讲时,我最近开始深入研究用于交互式数据可视化的两个主要(免费)工具:GGobi和mondrian - 两者都提供了广泛的功能(即使它们有点错误)。
我想请你帮忙(对我自己和我未来的观众)什么时候使用交互式情节有帮助?数据探索(为我们自己)和数据展示(为“客户”)?
在向客户解释数据时,我可以看到动画的价值:
- 使用“识别/链接/刷”来查看图表中的哪个数据点是什么。
- 呈现数据的敏感性分析(例如:“如果我们删除这一点,这就是我们将得到的)
- 显示数据中不同组的影响(例如:“让我们看看男性的图表,现在看看女性的图表”)
- 显示时间的影响(或年龄,或一般来说,为演示提供另一个维度)
因为当我们自己探索数据时,我可以看到在我们正在处理的数据集中探索异常值时识别/链接/刷的价值。
但是除了这两个示例之外,我不确定这些技术提供了哪些其他实际用途。尤其是对于我们自己的数据探索!
可以说,交互部分有利于探索(例如)数据中不同组/集群的不同行为。但是当(在实践中)我接近这种情况时,我倾向于做的是运行相关的统计程序(和事后测试)——我发现重要的事情然后我会用颜色清楚地将数据划分为相关群体。据我所见,这是一种比“探索”数据更安全的方法(这很容易导致数据疏浚(如果校正所需的多重比较的范围甚至不清楚)。
我很乐意阅读您对此事的经验/想法。
(这个问题可以是一个维基——虽然它不是主观的,一个深思熟虑的答案会很高兴赢得我的“答案”标记:))