如何在一系列时间戳中找到模式

数据挖掘 Python 时间序列 无监督学习 异常检测
2021-09-17 17:23:31

我有一系列时间戳,代表用户单击某个按钮的时间。

我的目标是检测自动点击,因此我需要在数据中找到可能指向自动脚本的重复模式。大部分数据来自普通用户。我不需要在线检测它们,我只需要在历史数据中检测它们。我也有 user_id 来区分用户。

是否有一种默认方法来检测大部分非结构化数据集中的重复模式?

我发现的大多数事情都是关于与时间戳配对的某个值的异常检测,但我的问题并不是真正的异常检测,因为我需要在无模式数据中找到模式

1个回答

如果您只有每个时间戳的点击次数,这个问题可能会非常困难。原因是您可能会发现许多不同的循环模式!例如,年、月或日中的某些时间段(根据网站的功能)可能会吸引某种时间模式的点击。但是,如果您有更多相关的功能,情况就不同了。

毕竟我会指出一些方向并希望它有所帮助:

自相关最初可能会让您对那里发生的事情有一个很好的了解。

然后使用时间扭曲方法来定义相似函数并沿着时间序列寻找它。

嵌入高维空间揭示了时间序列的时间循环模式。它主要来自物理文献,被称为状态空间重建。此方法使用此方法将您的时间序列转移到 m 维空间中,在那里您可以将时间序列视为一个动态系统,这可能有助于检测循环动态。