一个潜在的想法是使用桑基图来记录类别之间的选择流程。描述我在说什么的两个例子是;
随着您在评论中表达的一些担忧的更新。在我看来,Parallel Sets 程序可以满足您的要求。下面是程序的输出,其中我创建了 4 个具有 4 个类别的随机变量。无论您初始化到显示顶部的哪个组,都将在后续类别中按顺序划分。创造你想要的分裂。
在这张图片中也不明显,该包具有一些交互式功能,可以更轻松地进行探索性数据分析,例如当您将鼠标悬停在其中一个类别上时,它的所有后代都会突出显示。
我已将相同的数据集上传到 Fineo,您可以在此处探索。除了最初的 4 个类别变量(命名dec1
为dec4
)之外,我还包括了允许您检查拆分类别的串联类别。带有后缀的变量的命名约定exp
是它是dec
通过连接先前选择的类别而扩展的变量。所以dec3_exp12
会被标记为121
if dec1 = 1 and dec2 = 2 and dec3 = 1
。您可以在 Fineo 中创建与 ParSets 中可用的相同的拆分类型结构,但在此示例中它无法呈现具有或更多节点的类别。43
在玩了 Fineo 之后,它是一个简洁的应用程序,但它确实是有限的。Parallel Sets 有更多的功能,所以我建议你在 Fineo 应用程序之前检查一下。
我认为 ParSets 程序比连续将类别分成子集进行检查要好得多。例如,使用与上面相同的随机数据,这里是一个点图,绘制了decision 2
所选类别中的比例类别,条件是为 选择的类别decision 1
。
您可以对从decision 2
到的更改进行相同的细分decision 3
,但为最初的情况制作一个小的多重图表decision 1
。
您可以无限继续此操作(见下文)。这可能很有启发性,但我怀疑当你到达更多面板时它会相当令人生畏。下面是根据要求,可视化 4 个连续的类别选择。
如前所述,当您将图形分成这么多类别时,数量很少是有问题的。解决这一问题的一种方法是将诸如尺寸之类的美学映射到比例所基于的基线。这会根据视图中较小的数字缩小观察结果。您也可以使用透明度(但我已经使点透明以区分此示例中的过度绘制点)。
我想有些人正在设想像节点结构而不是点图的圣诞树,但我不知道如何制作这样的图形。我怀疑它会怀疑同样的压倒性问题。这些小的倍数还不错,但是 IMO 平行集更加直观,我怀疑一些不明显的模式在可视化中会更加明显。也许比我更有想象力的人能想出一些比 4 个随机类别更有趣的数据。