我正在寻找 Data Scout 的定义。
数据挖掘和数据侦察有什么区别?
我正在寻找 Data Scout 的定义。
数据挖掘和数据侦察有什么区别?
在业务中,几乎没有时间查看在特定分析项目之前已消除的数据,因此我将这些数据放在 elim_bin(项目代码#,项目日期)中,我总是为每个消除附加数据源和提取的日期。
后来,我可以用算法“侦察”这些数据,看看是否有什么有用/学习的东西。
这就是我使用“侦察”数据的方式。希望这可以帮助。
从我在这里找到的摘要中复制- 阅读论文以获得更多见解:
在 2011 年,CMS 合作引入了数据侦察的新概念,允许获取否则会被通常的触发过滤器拒绝的数据。这种基于事件大小缩减的特殊数据流是为了保持对衰减到喷射或μ子的新光共振的敏感性,分配给它的在线和离线资源非常少。显示了这个新工作流程所暗示的挑战以及在 CMS 实验中开发的解决方案。这种技术现在是 CMS 数据获取策略的标准成分。介绍了 CMS 中数据搜索的现状。
我不是物理学背景,因此在阅读大体上的论文时,我无法完全理解上下文。但至少这让你知道它是什么。
来到数据挖掘,你可以找到很多定义。我的定义是使用原始数据从大型数据集中寻找模式或见解。这可以通过使用数学、计算机科学或统计学中的许多算法来完成。
一些数据挖掘算法是k-nearestneighbor、k-means、朴素贝叶斯等。
那么数据侦察和挖掘有什么区别呢?在挖掘中,您考虑原始数据集并执行一些操作。在侦察中,如果我没有看错的话,您在执行某些操作时将被某些过滤器(不知道这些过滤器是什么)丢弃的数据,然后考虑该数据执行附加操作。