可视化时间数据的最清晰方法?

数据挖掘 聚类 数据 可视化 信息图表
2022-03-09 16:25:15

我收集了过去一个月在当地巴士站的巴士到达时间 - 所以我的巴士(特定巴士号码)在一周中的每一天(星期一、星期二等)出现在我的巴士站时.

我正在努力确定显示这些数据的最佳和最清晰的方式。最终,我想使用聚类算法来帮助了解公共汽车最有可能出现的时间。所以在星期一,我知道公共汽车是否更有可能在早上 7.45 或 7.48 出现。

我相信 8 个图表将是最好的 - 一周中的每一天一个图表,然后一个最终图表显示平均值,而不管一周中的哪一天。对于清楚地可视化这些数据,我最好的图表类型是什么?

2个回答

使用箱线图怎么样,所以你也可以在某种程度上可视化方差。每个箱线图可以代表一个工作日。

当你只看平均值时(此时在公交车站),你很有可能错过公交车(对于形状良好的非偏斜分布,大约 50%)。

您要确保您在正确的时间到达车站(大约 95% 的机会乘坐公共汽车)。因此方差很重要。

在此处输入图像描述

图片来自此页面:https ://www.datamentor.io/r-programming/box-plot/

或者,您可以在到达时间上训练模型,对每一天进行预测,并绘制包含 95% 置信区间的预测值。但这在这里可能太多了。

堆叠直方图或堆叠核密度估计。

每天使用不同的颜色。然后你就可以很容易地比较日期,例如,看到星期日在某些时候丢失,而星期一到星期五的条纹是一样的。