我正在努力做以下事情并且已经徒劳地花了几个小时:
我想做散点图。但是考虑到这些点的高度分散,我想对 x 轴进行分箱,然后对于 x 轴的每个箱,绘制每个箱中数据点的 y 值的分位数:
- x 轴上统一的 bin 大小;
- 每个箱中的观察次数相等;
(这两个是不同的情况。)
如何在 R 中做到这一点?我想为了漂亮,我最好在ggplot2中做?
这个问题的根源是一个简单的散点图有太多的高分散点产生了太多的点在各处飞来飞去。
我们正在尝试使图表平滑一点...
有什么好的建议吗?
“绘制每个箱的分位数”怎么样?
但是分位数是如何绘制的?我应该指定 50% 的分位数等吗?
[ps 更新 3/11/2011]:我正在尝试以下 R-help 帖子:
DAT <- data.frame(x = runif(1000, 0, 20), y = rnorm(1000))
DAT$xbin <- with(DAT, cut(x, seq(0, 20, 2)))
p <- ggplot(DAT, aes(x = x, y = y)) + geom_point(alpha = 0.2) +
stat_quantile(aes(colour = ..quantile..), quantiles = seq(0.05, 0.95,
by=0.05)) + facet_wrap(~ xbin, scales = "free")
print(p)
我的问题是:
1)如何使其沿 x 轴的每个 bin 中的“点数相等”?即我的问题中的原始数字 2 要求?
2)而且,无论我如何更改quantiles = seq(0.05, 0.95,
by=0.05))行,每个 bin 中的行数和每个图右侧的图例数都是不同的......
有什么问题?我在这里错过了什么吗?
我以为分位数线的数量和图例的数量应该完全一样,不是吗?



