我有一个数据集,其中包含有关人们何时进入和离开场所的信息。我在数据集中有以下信息:
- 人员 ID
- 入境时间
- 离开时间
该数据集有大约 50 个独特的人。每个人将有多个条目对应于多次访问。数据跨越一年多,所以我有很多条目(大约 100 万)。
这些人可以根据他们工作的部门(2 个部门 - 相互排斥)或他们的角色(4 个可能的角色 - 所有相互排斥)进行分类
我想知道用这种数据集可以做什么样的数据分析。我不是在寻找直截了当的东西,比如“谁在建筑上花费的时间最多”。然而,像找到 2 个人的访问之间的相关性这样的事情会很有趣。因此,如果 A 人访问了前提,那么 B 人也会访问的概率是多少。由于我只有大约 50 个独立访问者,我认为这样的分析是可行的。
另一种思路是应用一些区间模式挖掘技术,但我对它们不太熟悉。
有人可以给我一些关于可以使用这种数据构建什么样的数据产品或可以对这些数据使用什么样的技术的指示/想法。
编辑:正如评论中所讨论的,我将其称为产品,因为我不想进行一些简单或琐碎的分析。而且我不是在寻找任何商业上可行的想法——只是一些很酷的有趣想法:)