异常顺序用户行为的检测

数据挖掘 异常检测 顺序模式挖掘
2022-02-17 07:14:43

我有一个包含一组普通用户会话的数据集。每个会话包含一组对 N 个系统资源 {R1, ..., RN} 的有序用户请求。

在此处输入图像描述

我想设计一个连续的身份验证算法,通过在每个请求命令处确认用户身份。更准确地说,我不会让用户完成整个会话(所有命令序列)来对他进行身份验证,但我想根据他之前在数据集中的正常序列对每个资源请求的命令执行此操作。

如何在正常序列上构建模型以按资源方式检测异常序列?

我发现了很多关键概念(Sequential Pattern Mining,Sequence Anomaly Detection,......),但我对这些概念完全感到困惑

我想知道如何开始以及应该使用哪种 ML 算法。

1个回答

您的问题通常称为离散序列异常检测。

开始的一种方法是为当前项目生成异常分数。如果异常分数高于阈值,则将其标记为“异常”。

这种方法的一个例子是 Weng 和 Liu 的“ A Sequence Anomaly Detection Approach Based on Isolation Forest Algorithm for Time-Series ”。