用于类区分数据的 Base R 中的图例图例给出了实际类别的不正确表示

数据挖掘 r 可视化 图表 ggplot2
2022-03-13 10:28:30

我是 R 新手。在完成大学作业时,我发现 Base R 图的图例没有显示正确的信息,因此我在需要图例的地方切换到 ggplot2。

我观察到虽然 Base R 颜色对数据进行了颜色编码(示例由我们的作业中要求的 CLASS 区分)但图例未能显示关于配色方案的正确 CLASS 即在图中,如果青色实际上是代表 A5 类(给定点的位置) ,图例将显示其他东西说青色作为 A3 类。没有办法知道它是错误的,直到您尝试与 ggplot2 相同并找到差异。

ggplot2 永远不会发生相同的错误。我已附上结果和代码以进行比较分析。

我为 Base R 使用了以下代码:

#A scatter-plot of SHUCK versus VOLUME differentiated by CLASS
plot(y=mydata$SHUCK,x=mydata$VOLUME,main = "SHUCK versus VOLUME (differentiated by CLASS)",col=mydata$CLASS, xlab = 'Volume',ylab = 'Shuck', pch=16)
# Add a legend
legend("topleft", legend=levels(mydata$CLASS), pch=16, col=unique(mydata$CLASS))

在此处输入图像描述

如果我使用 ggplot2 运行类似的代码,我会得到显示不同结果的图例。我将以下代码用于ggplot。

x <- ggplot(mydata, aes(VOLUME, SHUCK)) + theme_bw()
x + geom_point(aes(fill = CLASS), shape = 23, alpha = 0.75)

在此处输入图像描述

为了进一步澄清,如果我们检查带有图例的 Base-R 和 ggplot 的图像,似乎 ggplot 的粉红色 A5 类由 Base R 的青色 A3 类表示,这是错误的

我知道我在使用 Base R 时做错了什么。我应该如何在 Base R 中添加图例,以便图例与图形中颜色编码表示的顺序同步,以保持实际数据点类别表示的准确性,以防万一分类数据?

有没有人有同样的经历?任何指导都会有所帮助。谢谢

0个回答
没有发现任何回复~