我正在使用 seaborn violin plot 功能,但是小提琴的尺寸不是我所期望的。有谁知道这是否是我做错的事情,或者我怀疑这是否是 seaborn 中的错误。
我正在使用的代码如下;
sns.violinplot(x = "Issue Type", y = "issue_adj_risk_score", data=subset, scale="count", cut =0)
我能看到的图表是这样的
据我了解,因为我使用了scale ="count"
参数,所以这些小提琴中的每一个的大小应该与每个区域的总数量成正比。然而,在“类别 1”(粉红色)中,我共有 936 个 issue_adj_risk_score 为 1,而在第 2 类(橙色)中,我共有 1212 个 issue_adj_risk_score 为 1。
但是我很困惑,因为粉红色比橙色大!:-(
有谁知道这可能是为什么?
编辑
我现在看到特定类别的范围不一致的进一步问题。我有一个数据集并使用 violinplot 绘制以下内容
在这里,我们可以看到某个类别(我用红色突出显示)的范围为 1-4。这让我感到惊讶,所以我查看了基础数据,它在 4 处不包含任何值。然后我取了一个仅包含此类别的子集,并用相同的数据绘制了一个小提琴图并得到了这个
这是我期望在初始图表中看到的!
为了进一步研究这个问题,我再次根据原始数据绘制了一个箱线图,得到了以下结果
这与第一张图表一致,但不反映实际数据。这三个图表怎么可能来自相同的数据!!???