在我可以在网上看到的所有示例中,人们都使用了带标签的数据集。然而,我一直试图构建一个模型来对未标记的数据集执行异常检测(无监督异常检测)。
问题陈述:将异常点与正常点分开。我们提供的功能有 mem_usage、mem_total、cpu_usage_idle、cpu_usage_iowait 等
使用异常检测,我计划标记数据集是否异常。进一步的步骤是根据数据所属的服务器聚合每一行,并确定服务器是否健康、有问题。更进一步的是预测服务器何时可能面临类似问题,从而提出缓解问题的方法。
任何类型的资源(论文、代码博客、视频)都非常受欢迎。我刚刚开始,也愿意尝试新的东西。