如何可视化图表中类别的总数和子类别的比例?

机器算法验证 r 分类数据 数据可视化 ggplot2 多类
2022-04-07 03:09:13

假设我从类别 A、B、C 中抽取样本。在这些类别中,我有子类别 d、e、f,它们在所有 3 个类别中都可以找到。我想可视化我有多少样本构成类别 A、B、C以及每个类别中子类别 d、e、f 的比例组成。

一种方法是使用条形图(我使用的是 ggplot2,并不是说它太重要),其中 A、B、C 的条形图的高度与其样本总数成正比。在每个条中,我根据类别中 d,e,f 的组成通过填充颜色对其进行划分。这样做的问题在于,由于 A、B 和 C 的高度不同,因此几乎不可能直观地比较比例 - 例如,d 在 A 中的比例与 d 在 B 中的比例。

要查看比例,我可以将高度重新归一化为 100% 而不是样本计数,以便 A、B 和 C 的条形现在高度相等。但是,现在我无法想象 A、B 和 C 中的计数。

有没有一种优雅的方法可以同时可视化这两条信息?

1个回答

这个嵌入/分层条形图的示例可能代表一种替代方案。三个主要类别由单独的条表示,然后嵌入子类别条(在 ggplot2 中创建)。

博客链接(学习 R)