这是一个相当普遍的问题,也许有点基于意见。
在大多数论文中,人们使用箱线图来可视化某个分布,但小提琴图能够提供更多信息。小提琴图是通过对您的分布执行核密度估计来制作的。
是否有客观的论据可以使用其中一种?或者,也许在某些特定情况下,人们会更喜欢其中一种?
可以在此处找到两者的示例:
这是一个相当普遍的问题,也许有点基于意见。
在大多数论文中,人们使用箱线图来可视化某个分布,但小提琴图能够提供更多信息。小提琴图是通过对您的分布执行核密度估计来制作的。
是否有客观的论据可以使用其中一种?或者,也许在某些特定情况下,人们会更喜欢其中一种?
可以在此处找到两者的示例:
我是小提琴情节的忠实粉丝。尽管两者都针对相同的目标(为此可视化分布和关键数据),但箱线图有其局限性。请查看以下 gif [1]):箱形图无法捕捉原始数据的变化,而 voilin-plots 可以:
[1] 取自https://www.autodesk.com/research/publications/same-stats-different-graphs
很大程度上取决于用户和观众的偏好(小提琴情节更不寻常可能会让人失望),所以这主要取决于你。
使用小提琴图的一个主要原因是提供有关分布的更多细节,因为箱线图只是在均值、stddev 和 2 个 stddev 处给出了硬停止。因此,如果您认为这些点之间的分布中包含有趣的信息,请选择小提琴。
另一个主要原因是他们更关注 Kaggle ;)