我正在使用的数据高度偏斜,绝大多数数据集中在 0。似乎很难突出这些分布之间的差异:
gamma1 <- rgamma(10000, shape=0.05, rate=1)
gamma2 <- rgamma(10000, shape=0.055, rate=0.98)
gamma3 <- rgamma(10000, shape=0.06, rate=0.95)
c(mean(gamma1), mean(gamma2), mean(gamma3))
[1] 0.04845668 0.05253655 0.05797983
ks.test(gamma1, gamma2)
Two-sample Kolmogorov-Smirnov test
data: gamma1 and gamma2
D = 0.0433, p-value = 1.44e-08
alternative hypothesis: two-sided
ks.test(gamma2, gamma3)
Two-sample Kolmogorov-Smirnov test
data: gamma2 and gamma3
D = 0.0456, p-value = 1.864e-09
alternative hypothesis: two-sided
ks.test(gamma1, gamma3)
Two-sample Kolmogorov-Smirnov test
data: gamma1 and gamma3
D = 0.0798, p-value < 2.2e-16
alternative hypothesis: two-sided
由于大多数数据为 0,直方图对于查看分布之间的差异不是很有帮助(更不用说在 R 中绘制具有多个分布的直方图似乎不是一种方便的方法,请参阅https: //github.com/hadley/ggplot2/issues/1081):

小提琴图似乎歪曲了分布的形状(它们看起来比实际更正常),并且由于平均值非常低,这些框几乎是不可见的:

由于这些图并没有真正显示出任何有用的东西,我想知道是否有更好的方法来可视化偏态分布?

