如何总结多个时间序列,如数据集

数据挖掘 熊猫 图表
2022-02-12 19:39:29

我正在运行一个实验,我每秒对 CPU 利用率进行采样。

每次实验运行的数据片段如下所示:

timestamp   cpu1  cpu2  cpu3  cpu4        
1.581015e+09    0.0   0.0   0.0   0.0
1.581015e+09   41.6  57.4  54.5  47.0
1.581015e+09   84.3  72.5  46.6  82.8
1.581015e+09    1.0  83.7   1.0   2.0
1.581015e+09   33.0  43.3  44.4  37.8

我正在使用熊猫来探索数据。

为了保证实验的有效性,我重复实验20次。

现在我有上面每个数据集的 20 个。

我现在的问题是什么是最好的策略:

  1. 总结数据。
  2. 图表数据摘要

如果我只有一次跑步,我想在线聊天中绘制数据,但现在我有 20 次,不知道如何进行。

在所有 20 个数据集中找到每秒的平均值?或者有什么推荐的方法来处理这个?

1个回答

这取决于您要显示的内容以及图表中适合多少信息。通常你可以想到:

  • 只需为每个数据集使用不同的颜色,但 20 可能太多了,这会使图表难以阅读。
  • 在每一时刻使用箱线图(或小提琴图),箱线图代表数据集的 20 个值。