使用 R 随时间绘制分布的好方法是什么?

机器算法验证 r 时间序列 数据可视化
2022-03-24 14:30:31

我有大约 400 个人和超过 10k 个时间点(模拟结果),我希望能够监控它们随着时间的推移而变化。绘制所有个体太混乱,绘制均值 +-sd、最小值/最大值或分位数对于我的口味来说信息太少。我想知道其他人想出了什么来可视化这种类型的数据。如果数据点较少,我会为每个时间点使用beanplots,但这不适用于这么多时间点。

2个回答

我会使用更平滑的,例如:

geom_smooth(method='loess')

或者我会对您的数据进行二次抽样,并仅每 5 个人和每 10 个时间步(例如)绘制一次。

library(ggplot2)    
# Data looks like:
#   Subject   Timestep  Y
#   1         1         0.5
#   1         2         0.6    
#   1         3         0.6
#   1         4         0.7
temp=subset(data, ((as.numeric(subject)%%5)==0) & ((as.numeric(Timestep)%%10)==0))
qplot(Timestep,Y,data=temp)

或两者。

这些是一些很棒的建议。我的建议是使用R函数和图形使用http://biostat.mc.vanderbilt.edu/HmiscNew中所示的半小提琴图。HmiscsummarySlattice