我的应用程序在随机时间接收具有随机位数的消息。但两周前,我开始注意到我的应用程序指标的一些几乎规律的模式。我怀疑它们是一些向我的应用程序发送人工生成的数据的机器人。具体来说,我正在寻找消息具有几乎相同位数的时间序列中的顺序消息子集。
我阅读了一些方法,但它们使用时间不是随机变量的数据。感谢您提供的任何帮助,包括书籍、网页、教程(如果可能,使用 Python)等。
我的应用程序在随机时间接收具有随机位数的消息。但两周前,我开始注意到我的应用程序指标的一些几乎规律的模式。我怀疑它们是一些向我的应用程序发送人工生成的数据的机器人。具体来说,我正在寻找消息具有几乎相同位数的时间序列中的顺序消息子集。
我阅读了一些方法,但它们使用时间不是随机变量的数据。感谢您提供的任何帮助,包括书籍、网页、教程(如果可能,使用 Python)等。
作为第一步,要隔离看起来是机器人的消息,您可以首先尝试按消息大小进行分箱。例如,如果机器人发送的消息可能在 128 到 140 字节之间,请将它们分配给唯一的 bin。
接下来,基于此 bin 创建一个时间序列。尝试使用诸如 Holt Winters 之类的加法或乘法方法分解时间序列。强烈的季节性成分将帮助您识别自动生成的常规和重复消息。