背景:最近几个月,Elastic 收购了 Prelert,并将积极将其纳入 Elastic 堆栈(同时停止 Splunk Anomaly Detective 应用程序!)。我正在尝试了解他们的时间序列异常检测预测分析方法的理论方法和流程框架,以便我可以成为 Prelert 工具的有效和高效用户。
问题:要探索哪些主题,一般流程/管道是什么?一个人将如何开始学习和理解所涉及的大概念的构建块。我从网上的一些帖子中了解到(1、2) 稍微了解一下它是如何工作的,但想了解所涉及的主要流程项目。在高层次上,我知道有一些训练集通过无监督 ML 拟合分布,并且该分布用于评估未来事件的概率 - 但需要进入所涉及的顺序处理块(例如,数据读取步骤,然后将其发送到分布匹配步骤,然后是一些无监督的 ML 步骤,其中选择/调整分布等)。我知道细节可能很困难,所以在这个领域有经验的人的猜测和假设的想法会很棒。
注意 1:我对 Prelert 的“秘诀”和他们开发的确切专有算法不感兴趣——这将是不道德的,我不想重新创建他们的产品,我只想了解如何更好地使用它。我对在高层次上实现的主要概念的解释感兴趣,但比我发现的帖子(1、2)更详细。解释的示例帖子可以采用以下形式:
- '分布通过 X 概念/算法填充,然后通过 Y 机器学习概念/算法进行选择。可能要研究的概念是 A、B、C。文献检索的关键词是Q、W、E。一些参考是 N,M,L。
注 2:我之前发布过一个相关主题,但对于类似的观众来说,这可能是一个有趣的附带问题。