我有大约 400 个人和超过 10k 个时间点(模拟结果),我希望能够监控它们随着时间的推移而变化。绘制所有个体太混乱,绘制均值 +-sd、最小值/最大值或分位数对于我的口味来说信息太少。我想知道其他人想出了什么来可视化这种类型的数据。如果数据点较少,我会为每个时间点使用beanplots,但这不适用于这么多时间点。
使用 R 随时间绘制分布的好方法是什么?
机器算法验证
r
时间序列
数据可视化
2022-03-24 14:30:31
2个回答
我会使用更平滑的,例如:
geom_smooth(method='loess')
或者我会对您的数据进行二次抽样,并仅每 5 个人和每 10 个时间步(例如)绘制一次。
library(ggplot2)
# Data looks like:
# Subject Timestep Y
# 1 1 0.5
# 1 2 0.6
# 1 3 0.6
# 1 4 0.7
temp=subset(data, ((as.numeric(subject)%%5)==0) & ((as.numeric(Timestep)%%10)==0))
qplot(Timestep,Y,data=temp)
或两者。
这些是一些很棒的建议。我的建议是使用R包函数和图形使用http://biostat.mc.vanderbilt.edu/HmiscNew中所示的半小提琴图。Hmisc
summaryS
lattice
其它你可能感兴趣的问题