在我的领域中,绘制配对数据的常用方法是一系列细斜线段,将其与两组的中位数和 CI 重叠:
然而,随着数据点的数量变得非常大(在我的情况下,我有大约 10000 对),这种图变得更难阅读:
降低 alpha 会有所帮助,但仍然不是很好。在寻找解决方案时,我遇到了这篇论文,并决定尝试实现“平行线图”。同样,它适用于少量数据点:
很大时,更难让这种情节看起来很好:
我想我可以分别显示两组的分布,例如使用箱线图或小提琴,并在顶部绘制一条带有误差线的线,显示两个中位数/CI,但我真的不喜欢这个想法,因为它不会传达数据的配对性质。
我也不太热衷于 2D 散点图的想法:我更喜欢更紧凑的表示形式,理想情况下,两组的值沿同一轴绘制。为了完整起见,以下是二维散点图的数据:
有谁知道用非常大的样本量表示配对数据的更好方法?你能把我链接到一些例子吗?
编辑
抱歉,我在解释我在寻找什么方面显然做得不够好。是的,2D 散点图确实有效,并且有很多方法可以改进它以便更好地传达点的密度 - 我可以根据核密度估计对点进行颜色编码,我可以制作 2D 直方图,我可以在点等上面绘制轮廓,等等......
但是,我认为这对于我试图传达的信息来说太过分了。我并不真正关心显示点本身的 2D 密度——我需要做的就是以尽可能简单和清晰的方式表明“条”的值通常大于“点”的值,并且不会丢失数据的基本配对性质。理想情况下,我想沿着相同的而不是正交的轴绘制两组的配对值,因为这样可以更容易地在视觉上比较它们。
也许没有比散点图更好的选择,但我想知道是否有任何可能的替代方案。