小时间序列的平均偏差和标准偏差的数据可视化

机器算法验证 r 时间序列 数据可视化 多类
2022-04-17 19:53:51

我正在尝试找到可视化以下数据的最佳方法:

我有 3 个不同时间/日期的值,每个时间/日期都有相同的 20 个物种。对于每个物种,我都有平均高度和标准偏差(从 n 次观察中获得)。我没有从中获得平均值和标准偏差的观察结果。

这就是数据的样子。物种从 1 到 20 编号。

t1 = cbind(seq(1,20,1),runif(20,0.5,5.0),runif(20,0,1.0))
t2 = cbind(seq(1,20,1),runif(20,0.9,6.0),runif(20,0.2,1.5))
t3 = cbind(seq(1,20,1),runif(20,0.1,8.5),runif(20,0.4,1.0))

任何人都可以就什么是最好的情节/图形提供任何建议吗?我想及时显示平均值和标准差的演变,但是我不想做线图,对于热图,我有一个小数据集。

2个回答

你的意思是你不想要这样的线图?:)

在此处输入图像描述

对于 X 轴和线图来说,时间是很自然的。这是使用小倍数方法的更好视图。

在此处输入图像描述

有时它有助于通过一些分析来订购面板。这是一个按平均标准排序的示例:

在此处输入图像描述

有这么多类别级别 (20),另一种技术是将相似级别聚类并将它们叠加在一起。这是一个包含 4 个集群的示例。(不为明显但可解决的着色和标签缺陷烦恼。)

在此处输入图像描述

为什么不是线图?如果您想显示平均值和 SD 的一般趋势,则线图似乎非常合适,前提是单个物种不是焦点。


无论如何,这是一个替代方案,严格来说仍然是线图,但时间不是轴之一。它也有利于讨论个别物种。x 轴是你的变量 1(我猜这是意思),y 轴是变量 2(SD)。

在此处输入图像描述


是的,热图可能太多了,但我认为如果您也可以提供实际数据,则值得尝试显示 3D 内核密度。代码取自这个线程

在此处输入图像描述


另一种可能性是制作三个图:

  1. t1 SD 与平均值,使用黑色符号
  2. t1 SD 与平均值,但这次符号变为浅灰色;覆盖 t2 SD 与平均值,使用黑色符号。用箭头连接每个物种对。
  3. t2 SD 与平均值,但这次符号变为浅灰色;覆盖 t3 SD 与平均值,使用符号。用箭头连接每个物种对。