什么是断轴的替代品?

机器算法验证 数据可视化 对数
2022-01-28 06:55:34

用户经常试图打破轴值以在同一图表上呈现不同数量级的数据(参见此处)。虽然这可能很方便,但它并不总是显示数据的首选方式(充其量可能会产生误导)。显示几个数量级不同的数据的替代方法是什么?

我可以想到两种方法,对数据进行对数转换或使用格子图。还有什么其他选择?

4个回答

对在条形图上使用对数轴非常谨慎问题是您必须选择轴的起点,而这几乎总是任意的。您可以选择使两个条具有非常不同的高度,或几乎相同的高度,只需更改轴上的最小值即可。这三个图表都绘制了相同的数据: 替代文字

没有人提到的不连续轴的替代方法是简单地显示一个值表。在许多情况下,表格比图表更容易理解。

一些额外的想法:

(1) 您不必将自己局限于对数变换。例如,在此站点中搜索“数据转换”标签。一些数据很适合某些转换,如根或 logit。(在为非技术受众发布图形时,通常要避免这种转换——甚至是日志。另一方面,它们可以成为查看数据模式的极好工具。)

(2) 您可以借用一种标准制图技术,在图表内或旁边插入图表的细节。具体来说,您可以将极值单独绘制在一个图表上,并将所有(或其余)数据绘制在另一个具有更有限轴范围的图表上,然后以图形方式排列两者以及关系的指示(视觉和/或书面)它们之间。想象一张美国地图,其中阿拉斯加和夏威夷以不同的比例插入。(这不适用于所有类型的图表,但对您插图中的条形图可能有效。)[我看到这与 mbq 最近的答案相似。]

(3) 您可以在不间断的轴上并排显示断线图和相同图。

(4) 在您的条形图示例中,选择一个合适的(可能是极大拉伸的)垂直轴并提供一个平移实用程序。[这更像是一种技巧,而不是真正有用的技术,恕我直言,但在某些特殊情况下它可能有用。]

(5) 选择不同的模式来显示数据。例如,不要选择使用长度表示值的条形图,而是选择符号区域表示值的图表。[显然这里涉及到权衡。]

您对技术的选择可能取决于情节的目的:例如,为数据探索创建的情节通常不同于一般观众的情节。

也许它可以归类为格,但我会尝试;在一个面板中绘制所有缩放到最高的条形图,并在另一个面板上显示缩放较低的条形图。我曾经在散点图的情况下使用过这种技术,结果非常好。

我会将日志轴的问题与条形图的问题分开。

对数轴恕我直言,最适合以倍数出现或发生的事情(......当用......处理时增加了 20 倍)。
在这种情况下,1 = 10⁰ 是自然起源。有一整套物理/化学值实际上是对数的,例如 pH 值或吸光度,并且具有“自然”来源。对于 A 那将是对于水溶液中的 pH 值,例如 7。A=lgI0lgII0

如果没有起控制作用的合理且固定的原点(基线、空白),则条形图永远不会是合理的。但这与对数轴没有任何关系。
我对条形图的唯一常规用途是直方图。但我可以想象他们很好地展示了这个起源的差异(你也可以立即看到差异是积极的还是消极的)。因为条形图描绘了一个区域,我倾向于将条形图视为曲线下面积的非常离散的版本。也就是说,x 轴应该具有度量意义(可能是时间的情况,但不是城市)。

如果我发现自己想知道使用什么原点来记录“自然”原点为 0 的东西,我会退后一步,想一想正在发生的事情。很多时候,这样的问题只是表明日志在这里不是一个明智的转换。

现在,带有对数轴的条形图将强调以倍数发生的增加或减少。我现在能想到的明智的例子都与感兴趣的值有某种线性关系。但也许其他人找到了一个很好的例子。

所以我认为数据转换对于手头数据的含义应该是明智的。这就是我上面提到的物理化学单位的情况(A 与浓度成正比,例如,pH 与 pH 计中的电压呈线性关系)。事实上,如此多的情况是,日志单元获得了一个新名称,并以线性方式使用。

最后但并非最不重要的一点是,我来自振动光谱学,其中经常使用断轴。我认为这是为数不多的几个轴断裂不具有欺骗性的例子之一。但是,我们没有数量级的变化。我们只有 x 范围的 30 - 40 % 的无信息区域: 这是一个示例: 光谱 对于此示例,1800 - 2800 /cm 之间的部分不能包含任何有用的信息。
因此删除了无信息的光谱范围(这也表明了我们实际用于化学计量建模的光谱范围): 频谱无信息部分已删除

但是为了解释数据,我们需要精确读取 x 位置。但是一般我们不需要跨越不同范围的倍数(即有这样的关系,但大多数连接都比较复杂。例如:信号在3050/cm,所以我们有不饱和或芳香物质。但在1000/cm没有强信号,所以没有单,间,也没有1,3,5-取代的芳环......)
所以最好用更大的比例来描绘x(实际上我们经常使用毫米片状的指南或标记确切的位置)。因此,我们打破轴,并获得更大的 x 缩放: 光谱 - 断轴

实际上,它非常像刻面: 刻面版
但是断轴恕我直言,强调两个部分的 x 轴比例是相同的。即绘制区域内的间隔是相同的。

为了强调小强度(y 轴),我们使用放大的插图:
在此处输入图像描述
[ ...有关详细信息,请参见蓝色的放大 (x 20) νCH 区域 .... ]

这当然也可以通过链接图中的示例来实现。