可视化离散变量的正确方法是什么?

机器算法验证 数据可视化
2022-03-16 13:28:08

例如,在可视化不同国家的 GDP 或人均 GDP 时,我经常看到一个线图(或雷达图),其中 x 轴(或角度方向)代表国家,y 轴(或径向)用于 GDP 或人均 GDP 的值。我认为这并不完美,因为两国之间的价值观毫无意义。那么在这种情况下,有什么更好的方法来可视化数据呢?

更新示例数据来源

1个回答

没有“一种正确的方法”;有一些好的方法。

在我看来,最明显的是克利夫兰点图;它用于显示一个因子的数字数据。

在此处输入图像描述

有些人会为此使用条形图。如果您有一个有用的分类(例如按地区),您将按该分类进行拆分。

对于 GDP(无论是原始的还是人均的),该变量涵盖了几个数量级,因此查看对数尺度可能更有意义(这也消除了某些人可能对 0 不在规模以上)。

这样的情节有多种用途。1.国家之间的明确比较(A大于B?)。2.提取一个数据值(A的GDP是多少?)。

克利夫兰点图(或克利夫兰点图)基于对人们擅长或不擅长的比较类型的研究[1]。我们非常擅长沿常用尺度比较位置,相对长度稍差,相对面积或角度相当差。关于 1. 上面的比较是在点表示的值之间(该点更靠右)。2.这个比较是点和平行轴之间的比较,这两个比较我们都擅长。该图消除了几乎所有不能直接帮助这些比较的墨水。

快,哪个更大,柠檬还是酸橙?
在此处输入图像描述

非常细的条形图与克利夫兰点状图非常相似,并且有时可以做得很好(特别是当两个图都包含 0 时),但当您想为每个国家绘制多个数字时,点状图有优势,因为它们可以用不同的符号表示。如果您只能使用黑白,则此优势会更大。您也不能真正在条形图上使用对数刻度(条形图的底部从哪里开始,条形长度代表什么?)因此它不太适合跨越几个数量级的数据。

[1]:Cleveland WS 和 McGill, R. (1984),
“Graphical Perception: Theory, Experimentation, and Application to the Development of Graphical Methods,”
美国统计协会杂志,79 :387(九月),531- 554.