我正在尝试获取美国大型冠状病毒集群的数据,并将它们可视化以显示大小和不同的环境(监狱、医疗机构等)。我想展示不同设置之间的区别。
如果尺寸更相似,我会尝试显示堆积条形图(以尺寸为横轴,计数为纵轴)。不幸的是,这并不奏效,因为有些集群比其他集群大得多。
我的数据的前几行看起来像(有很多老年护理机构有 50 个案例):
size category
50 agedcare
50 agedcare
50 agedcare
50 agedcare
50 agedcare
50 agedcare
50 agedcare
底部看起来像(监狱和肉类包装设施爆发巨大)
931 prisons
981 prisons
1028 prisons
1031 meat
1051 prisons
1065 prisons
1098 meat
1107 prisons
1283 prisons
1362 prisons
1374 prisons
1791 prisons
2439 prisons
我可以做一些分箱,我得到了这个:
但是仍然很难立即看出其中一些设置类型的爆发较小,而其他设置类型的爆发则要大得多。
关于如何可视化的任何建议都会有所帮助(如果重要的话,我主要使用 python)



