我有来自网站负载测试的数据,其中有数千个数据点分布在大约 30 分钟内(这些值是网站的响应时间,以毫秒为单位)。这些值分布在 30 分钟范围内,但不是以恒定速率(即,某些点之间可能存在几毫秒,其他点可能处于相同的时间戳等)。
我想直观地呈现这些数据并绘制图表,但我不确定这样做的最佳方法 - 围绕任何类型的平均值或趋势线概念存在大量差异。
关于如何绘制这种类型的数据的方法,是否有任何公认的最佳实践?我担心选择一种糟糕的方法来平均/平滑数据并歪曲数据 - 例如低估一些异常值。
我玩过一个折线图,x 轴上是时间戳,y 轴上是同一分钟内的样本平均值。我还想考虑绘制数据的移动平均值,但我不确定我是否应该在相同的 N 分钟或最后 N 点的窗口中平均数据点。
我想确保我所做的任何选择看起来都是对数据的严格表示,而不是太业余。
更新:下面是我迄今为止制作的样本,图表上的每个点都被视为同一分钟内所有样本的平均值/中位数(即在 11:12:00.000 和 11:12:59.999 内) . 我将每分钟的样本数作为条形图包含在图像的后半部分,以便能够显示折线图中的任何单个点是否由于样本量小而看起来像异常值,尽管从美学上讲我认为条形图图表对于它提供的信息量来说占用了太多的空间。