我是数据科学的新手,有一个典型的问题。我有一个包含 metric1、metric2 和 metric3 的数据集。所有这些指标都是相互依赖的。我想检测 metric3 中的异常情况。目前,我正在使用来自 numenta.org 的 Nupic 进行分析,但它似乎并不有效。是否有任何可以检测多个参数异常的 ML 库?
多参数异常检测
数据挖掘
机器学习
大数据
统计数据
异常检测
2021-09-25 18:02:44
2个回答
同时使用 metric1 和 metric2 来发现 metric3 异常的一种方法是考虑残差分析。
在您的情况下,这将需要创建一个预测模型,其中 metric1 和 metric2 作为预测变量,metric3 作为响应变量。
然后,将 metric3 的残差计算为从其真实值中减去的预测值。现在,您可以将最低十分位数 [或任何其他百分位数] 的所有成员报告为一种异常,并将最高十分位数 [或任何其他百分位数] 的所有成员报告为另一种异常。
如果您将指标 3 标记为 , 在哪里 意味着这是一个异常,这成为一个 逻辑回归问题,其中.
其它你可能感兴趣的问题