在我的研究领域,显示数据的一种流行方式是使用条形图与“把手”的组合。例如,
根据作者的不同,“把手”在标准误差和标准偏差之间交替。通常,每个“条”的样本量相当小——大约六个。
这些图似乎在生物科学中特别流行——例如,参见BMC Biology 第 3 卷的前几篇论文。
那么你将如何呈现这些数据呢?
为什么我不喜欢这些情节
我个人不喜欢这些情节。
- 当样本量很小时,为什么不只显示单个数据点。
- 显示的是 sd 还是 se?没有人同意使用哪个。
- 为什么要使用酒吧。数据不会(通常)从 0 开始,但图表上的第一次通过表明它确实如此。
- 这些图表没有给出关于数据范围或样本大小的概念。
R 脚本
这是我用来生成绘图的 R 代码。这样您就可以(如果您愿意)使用相同的数据。
#Generate the data
set.seed(1)
names = c("A1", "A2", "A3", "B1", "B2", "B3", "C1", "C2", "C3")
prevs = c(38, 37, 31, 31, 29, 26, 40, 32, 39)
n=6; se = numeric(length(prevs))
for(i in 1:length(prevs))
se[i] = sd(rnorm(n, prevs, 15))/n
#Basic plot
par(fin=c(6,6), pin=c(6,6), mai=c(0.8,1.0,0.0,0.125), cex.axis=0.8)
barplot(prevs,space=c(0,0,0,3,0,0, 3,0,0), names.arg=NULL, horiz=FALSE,
axes=FALSE, ylab="Percent", col=c(2,3,4), width=5, ylim=range(0,50))
#Add in the CIs
xx = c(2.5, 7.5, 12.5, 32.5, 37.5, 42.5, 62.5, 67.5, 72.5)
for (i in 1:length(prevs)) {
lines(rep(xx[i], 2), c(prevs[i], prevs[i]+se[i]))
lines(c(xx[i]+1/2, xx[i]-1/2), rep(prevs[i]+se[i], 2))
}
#Add the axis
axis(2, tick=TRUE, xaxp=c(0, 50, 5))
axis(1, at=xx+0.1, labels=names, font=1,
tck=0, tcl=0, las=1, padj=0, col=0, cex=0.1)