如何分析哪个站点的数字最多

数据挖掘 可视化
2022-02-15 16:24:57

我正在尝试确定我们组织中的哪个站点更需要升级到 SEP 12,所以当我运行查询来计数时,我会得到这些类型的数字

Group       Windows_SEP_11  Mac_SEP_11  Windows_SEP_12  Mac_SEP_12
Arizona\A   417                  29              219         6
Arizona\B   380                  20              282        15
Arizona\C   340                  30              383        507
Arizona\D   310                  104             186        857
Arizona\E   307                  74              403        243
Arizona\F   285                  171             522        14
Arizona\G   269                  1               559        41

但是,当我找到百分比时,我会得到这些数字

Group          Win_Sep_11_%   Mac_SEP_11_%  Windows_SEP_12_%    Mac_SEP_12_%
Boston/Site 1   100               0                0               0
Boston/Site 2   100               0                0               0
Boston/Site 3   94                0                0               5

显然,百分比并不是一个很好的指标,因为波士顿/站点 1 只有 3 台计算机,波士顿/站点 2 只有 4 台计算机,等等。

分析数据的最佳方法是什么?我最终需要一个网站的视觉效果

  1. 许多计算机,和
  2. 非常需要升级到 SEP 12,即 SEP 11 的计算机多于 SEP 12。

请指出我正确的方向。

1个回答

最明显的可视化方法是在 Y 轴上显示计算机的数量和代表百分比的点的大小。类别(或您的情况下的站点)可以在 X 轴上表示。下图显示了一个示例,其中 Y 轴表示连续值(在您的情况下可以映射到计算机数量),X 轴表示离散值(在您的情况下可以映射到站点),大小点代表另一个属性(例如您的百分比)。我已经为此使用了该R软件包ggplot2在此处输入图像描述