可视化活动频率

机器算法验证 时间序列 数据可视化
2022-04-08 03:14:05

你好数据分析师社区。我有以下问题:

给定一组 n 个单位和一个以天为单位的时间线。一个单元在某一天可能在一定程度上处于活跃状态(范围从 0.0 到 1.0)。一个理想的结果是,如果一个单元处于活动状态,它应该在一系列连续的日子里处于活动状态(或者最多只有一天的休息时间)。

我所拥有的当然是相反的:)。现在我想测量甚至更好地可视化活动频率,以“证明”一个图像仿射人并非所有单位都按预期行事。蛮力方法是为每个单元(沿时间线)画一条线,根据活动程度进行着色,但由于 n > 30,图表很大,色彩丰富,你什么也看不到。

我害怕我在寻找错误的方向。任何想法,建议?

编辑:我想我无法解释我的目标:我不想可视化单个单元的活动,而是想了解所有相关单元的活动频率。在远端,我将有两组单元,并希望以图形方式查看一组是否比另一组表现更好(根据上述属性更好)。我很抱歉没有早点说明这一点(感谢到目前为止的贡献,我能够看到我真正想知道的内容)。

2个回答

您可能试图将太多信息合并到图形中。可视化的本质似乎是单元活动超过一天的频率,并且可能是这些单元活动的时间。

只是为了产生想法——因为有许多可能的解决方案——考虑一个显示,它提供了长期单位和短期单位之间的清晰图形区别,并允许评估这些发生的频率。一个简单的解决方案是散点图,其中一个单位在时间之间的连续活动xx+y由一个点表示(x,y). 修改点的一个显着特征,例如它的颜色,以强调它们之间的区别y1y<1.

这是一个粗略的说明:第一个在垂直轴上绘制单位(其中 200 个),在水平轴上绘制时间(75 天;它需要一个网格来显示时间单位),以及在灰度上对应较暗的单位活动到更长时间的连续活动。第二个将类似的数据显示为散点图。后者可以伴随着频率的直方图。前者应该按照平均服役年限对单位进行垂直排序。

替代文字

替代文字

如何为每个单元创建小时间线,一个在另一个之上,按活跃度从高到低排序?想想迷你图

您可能会做一些事情,例如将非活动时间突出显示为图表的阴影部分或单位时间线的彩色部分。

由于每个单元都有一个小图,因此您可以看到一个人在给定时间的活动。并且按活动对它们进行排序将显示某些单元的表现有多差,因为随着您沿着图形向下走,这些图会变得更平坦(和/或更多地充满您的不活动指示器)。

我对用什么软件创建它没有任何好主意。你也许可以用 R 中的 Lattice 来做到这一点。