想知道这个豆图分析图是什么意思

机器算法验证 数据可视化 箱形图
2022-03-24 20:29:52

如何解释和生成 bean 图。这是取自Walkes 等人的一个示例。2010 年它对哪种数据最有用?

豆图
(来源:biomedcentral.com

2个回答

箱线图实际上是为正常数据设计的,或者至少是为单峰数据设计的。Beanplot 向您显示了实际的密度曲线,它提供了更多信息。

形状是密度,短横线代表每个数据点。这结合了箱线图、密度图和地毯图的优点,并且非常易读。

不幸的是,您选择的示例决定添加一堆较长的线条,这些线条使图形变得无法识别(对我而言)。[剪辑]

编辑:现在更多地使用 beanplot,更长的粗线是每个 bean 的平均值(或可选的中值)。较长的细线是数据,具有某种“堆叠”,其中较宽的线表示更多重复值。(你也可以抖动它们,我更喜欢,但至少“正常”类别已经有相当密集的点,抖动可能会使情况变得更糟。)

我仍然认为您选择的示例相当混乱,也许可以通过使用抖动而不是堆叠来清除。

描述用于制作豆图的 R 包的论文是一本不错的读物。

在没有阅读整篇论文的情况下,它似乎本质上是箱线图的变体。因此,您可以在原本使用箱线图的地方使用它,例如比较多个组的单变量分布。它为每个点显示一条线并覆盖内核密度估计。从外观上看,我认为它可能对少量数据提供更多信息,但对更多数据来说过于混乱。乍一看,这对我来说似乎不是很惊天动地。如果您想了解更多信息,请详细说明您的问题。