热图是“最不有效的数据可视化类型之一”吗?

机器算法验证 数据可视化 热图
2022-01-27 19:09:28

问题:什么时候(对于哪些类型的数据可视化问题)热图最有效?(特别是,比所有其他可能的可视化技术更有效?)

什么时候热图最不有效?

是否有任何共同的模式或经验法则可以用来决定热图是否可能是一种有效的数据可视化方式,以及它们何时可能无效?

(主要是我想到了 2 个分类变量和 1 个连续变量的热图,但我也有兴趣听到关于其他类型热图的意见。)

背景:我正在参加有关数据可视化的在线课程,现在他们正在讨论无效和过度使用的绘图类型。他们已经提到了炸药图和饼图,以及为什么这些无效以及为什么有更好的替代方案的原因对我来说是清楚和令人信服的。此外,很容易找到其他来源证实关于炸药图和饼图的给定观点。

但是,该课程还说“热图是最不有效的数据可视化类型之一”。原因解释如下。但是当我试图在谷歌上找到其他地方来证实这一观点时,我遇到了很多困难,这与查找关于饼图和炸药图有效性的意见相比,我遇到了很多困难。所以我想知道课程中给出的热图特征在多大程度上是有效的,以及在给定背景下,反对它们的因素何时最不重要和最重要。

给出的理由是:

  1. 很难将颜色映射到连续的比例上。

    这个规则有一些例外,所以这通常不会破坏交易,但在热图的情况下,这个问题特别困难,因为我们对颜色的感知会根据相邻颜色而变化。因此,即使在小型数据集中,热图也不适合查看单个结果。这导致:

  2. 使用查表方法回答特定问题通常是不可行的,因为不可能足够准确地推断出与给定颜色对应的数值。

  3. 通常,数据并没有以能够显示趋势的方式进行聚类。

    如果没有这样的聚类,通常很难或不可能推断出任何关于一般整体模式的信息。

  4. 热图通常仅用于传达“令人惊叹的因素”或只是为了看起来很酷,尤其是在使用多色渐变时,但通常有更好的方式来传达数据。

以通用比例绘制连续数据始终是最佳选择。如果有时间分量,最明显的选择是线图。

4个回答

对于这个或那个,没有所谓的“最佳”情节。如何绘制数据取决于您要传达的信息。常用图的优点是用户更有可能阅读它们。然而,这并不意味着它们一定是最佳选择。

关于热图,我已经通过所谓的反对它们的论据来命令我的回应。

1)如果您不相信颜色作为编码通道,请改用亮度,其范围包括深灰色到浅灰色“颜色”色调。大多数情况下,您希望对连续变量进行分箱(另请参见 5),因此您可以保持较少的颜色数量并使其更容易被用户解码。这不是必须的。看一下这个例子,其中连续变量没有被分箱。

2) 当然,它们不应该用作查找精确值的替代方法。热图应该主要用于说明模式,而不是代替表格。

3,4)我不明白这与热图有何关系。

5) 理想情况下,热图但不一定与离散变量一起使用。对于连续变量,热图可以用作一种二维直方图或条形图,具有适当的分箱,以及亮度作为编码通道。

有人不能说热图是最不有效的可视化类型。我宁愿说这取决于您的要求。在某些情况下,热图非常有用。假设您必须按州(或按城市)报告某个国家/地区的犯罪情况。在这里,您将拥有一个庞大的数据集,该数据集可能具有时间依赖性。

同样,假设您必须准备一份城市用电量报告。在这些情况下,您可以通过热图轻松可视化。它会更有意义,也不会那么麻烦。

因此,简而言之,如果您有大量连续数据,并且想要制作一份可以快速确定答案的报告,那么热图是最好的。

原始问题中的批评 1 涵盖了最大的缺点 - 阅读热图的人很难解码所传达的定量信息。考虑一个 xy 散点图或点图,其中基础数量与图表上的距离直接相关 - 非常易于解释。

另一方面,在热图中,阅读图表的人可以自由地将 10% 的“更红”或“更暗”解释为自己满意。最重要的是人们辨别颜色和阴影的能力不同的问题。这些都是真正的缺点,但它们并不是普遍致命的。

相比之下,第三个批评似乎无意中确定了热图特别有用的场合——当数据聚集在 2D 平面上时,第三维中的相似值显示为特定阴影或颜色的斑块。因此,虽然热图在某些方面无效,但它们对其他方面很有用,它们应该放在你的包里,就像高尔夫球手经常携带劈起杆或类似物一样,尽管它们对驾驶或推杆无用,或者木匠不无视锤子,因为它们不适合切割木材。

一般来说,可视化数据应被视为迭代活动,当您尝试多种可视化以显示数据的重要特征时,这将需要一些时间,包括尝试不止一种可视化,然后尝试在其中找到最佳设置特定的选择。也不应该假设结果将是一个可视化 - 有时需要多个数据可视化来突出数据的多个重要特征。在这种情况下,有时对于特定数据集的特定特征,热图将是最有效的,并且所描述的通信集群可能是其中之一。总体而言,经常会出现单个可视化无法完成所有任务的情况,并且需要不止一个。

正如其他人所提到的,说热图总是无效的确实是不恰当的。实际上,它们在许多情况下都非常有效。

例如,如果你想可视化 4D 数据,在许多绘图软件中做前三个维度就足够简单了。然而,4D 的整个概念很难概念化。“第四”方向/维度是什么?

这就是热图可能有效的地方,因为它允许在坐标轴上绘制前三个维度,第四个维度可以通过将热图堆叠到绘制的平面(或线,但不太可能)上来可视化。

底线是您需要上下文。您在可视化中寻找什么?另外,作为一名自学者,我可以告诉你,这些在线课程往往非常琐碎和无益。最好仅在您寻找特定主题的信息/帮助时使用它们,而不是寻求有关整个主题的教学。

无论如何,祝你好运。