如何将第三个变量添加到条形图中?

机器算法验证 降维 多变量 条形图 数据可视化
2022-04-11 07:19:55

我正在尝试找到显示以下数据的最佳方式:

Course                               Grade  Avg   Diff.    Semester
EECE 253 - Circut Analysis II        64     71    -7       Two
MATH 253 - Multivariable Calculus    63     68    -5       One
EECE 360 - Systems and Control       73     73     0       Three
EECE 269 - Signals and Systems       63     62     1       Two
EECE 352 - Materials and Devices     69     68     1       Three
EECE 356 - Electrical Circuits II    70     69     1       Three
POLI 369 - International Security    79     78     1       Three
EECE 353 - Digital Systems Design    81     79     2       Three
CPSC 259 - Data Structs & Algrithms  78     74     4       Two
EECE 251 - Circuit Analysis I        87     82     5       One
EECE 259 - Intro to Microcomputers   76     70     6       One
EECE 281 - Project Design Studio     92     85     7       Two
EECE 261 - Electromagnetics          67     59     8       Two
MATH 264 - Vector Calculus           67     58     9       Two
MATH 256 - Differential Equations    82     71    11       One
APSC 201 - Technical Communication   96     83    13       One

到目前为止,这就是我所拥有的:(随意在这里玩)

我喜欢按差异排序显示它的想法,这样你就可以看到我落后和做得好的科目,所以我试过这样:

在此处输入图像描述

但我也想弄清楚如何将学期纳入图表,以查看我在哪些学期做得更好/更差,如下所示:

在此处输入图像描述

如何将学期合并到条形图中并按差异对其进行排序?或者,我应该放弃条形图的想法并使用完全不同的图表吗?

1个回答

我会避免在这里使用条形图。像这样的点状图在此类数据的大多数标准上得分更高。术语“点图”(或“点图”)在统计图形中被重载。这种风味通常被称为克利夫兰点图,以威廉·S·克利夫兰 (William S. Cleveland) 命名,他从 1980 年代中期开始推广其使用。在此处查看克利夫兰网站的链接

在此处输入图像描述

关键点:

  1. 条会占用大量空间和大量墨水。这里的成绩和平均分都在50%以上。我们可以放弃规模应该从 0 开始的不太重要的想法,转而支持更重要的想法,即我们应该公正对待有趣的变化。

  2. 我们可以使用排序来帮助查看一些模式。你说学期很重要,所以我们可以尊重这一点。在每个学期中,我们首先对成绩进行排序。我们可以对平均值或差异进行排序。

  3. 使用空心圆 o 和加号 + 作为两个符号意味着我们可以看到值不同的地方(容易)以及它们接近的地方(更难)。即使值相同,o 和 + 也不会相互遮挡。

作为奖励,更正了课程名称中的一些拼写错误。看来你关心的是部门、课程编号和课程名称。在其他问题中,此类文本描述符通常会被缩短。这里有足够的空间,尤其是当您从 50 开始时。您必须在设计中选择小字体,但可以避免这种情况。

这是一个变体,其中等级按差异(等级平均)排序:

在此处输入图像描述

有些事情常常不得不被淡化。在这个设计中,我放弃了明确显示差异的想法:它们只是隐含的。

作为记录,这是使用下面的 Stata 代码完成的。在所有主要的统计程序中,类似的事情都应该是微不足道的。

graph dot (asis) Avg (asis) Grade, over(Course, sort(2) descending) exclude0 yla(50(10)100) scheme(s1color) marker(1, ms(Oh)) marker(2, ms(plus)) linetype(line) lines(lc(gs12) lw(vthin)) over(Semester) nofill
graph dot (asis) Avg (asis) Grade, over(Course, sort(Diff) descending) exclude0 yla(50(10)100) scheme(s1color) marker(1, ms(Oh)) marker(2, ms(plus)) linetype(line) lines(lc(gs12) lw(vthin)) over(Semester) nofill

注意:在考虑了我的建议后,我查看了您的链接。他们不建议这种基本类型的图表是两者的弱点。

此处提及此类情节的线程包括thisthisthis

最后但同样重要的是,可以在 此处找到参考资料和详细示例。