我很难选择正确的数据可视化方式。假设我们有卖书的书店,每本书至少有一个类别。
对于一家书店,如果我们计算所有书籍类别,我们会获得一个直方图,该直方图显示该书店属于特定类别的书籍数量。
我想可视化书店的行为,我想看看他们是否更喜欢一个类别而不是其他类别。我不想看看他们是否都偏爱科幻,但我想看看他们是否平等地对待每个类别。
我有大约 100 万家书店。
我想到了4种方法:
对数据进行采样,仅显示 500 个书店的直方图。使用 10x10 网格在 5 个单独的页面中显示它们。4x4 网格示例:
与#1 相同。但是这一次根据它们的计数降序对 x 轴值进行排序,所以如果有一个偏爱它会很容易看到。
想象一下,将#2 中的直方图像套牌一样放在一起,并以 3D 形式显示它们。像这样的东西:
而不是使用第三轴使用颜色来表示颜色,而是使用热图(2D 直方图):
如果通常书店更喜欢某些类别而不是其他类别,它将显示为从左到右的漂亮渐变。
您是否有任何其他可视化想法/工具来表示多个直方图?