概念漂移是指输入数据和目标变量之间的关系随时间变化。比如条件分布的变化。
新奇是异常值吗?我应该怎么想?概念漂移与新颖性和异常性之间有什么区别?概念漂移是否被认为是一种新奇事物?究竟如何?你能解释一下吗?
概念漂移是指输入数据和目标变量之间的关系随时间变化。比如条件分布的变化。
新奇是异常值吗?我应该怎么想?概念漂移与新颖性和异常性之间有什么区别?概念漂移是否被认为是一种新奇事物?究竟如何?你能解释一下吗?
大致所有三个概念都是相关的。
漂移意味着输入和输出之间的关系是动态的,并且在(足够长的)时间段内(随机地)变化。也就是说,它不是静止的。例如,消费者关于购买什么的标准会随着时间的推移而变化,例如随着人们变得更加环保意识。更重要的是,漂移发生时,会使用于预测的现有模型失效。
异常也称为异常值,是一种非常罕见的非典型事件(当输入-输出关系被认为随时间静止时),它在特殊情况下发生。有点像白蛇。它可能会发生,但不是典型的蛇,如果发生,并不意味着输入-输出关系必然偏离原始假设(例如关于蛇颜色分布的假设)。因此,异常发生时,不会使用于预测的现有模型无效。
据我所知,新颖性是新事物和不可预测的事情的总称,但它可能归因于任何事情(漂移、异常等)。
请注意,确定观察到的新颖性的原因需要仔细分析(例如,多个异常可能意味着漂移是实际发生的事情)!
参考: