我一直在阅读有关检测数据漂移和概念漂移的内容,我找到了这个库,但似乎这里的所有方法都检测概念漂移并接受输入,就好像预测是否正确一样。(需要基本事实)这是正确的假设吗?
然后我偶然发现了 Kullback-Leibler Divergence 和 JS-Divergence。我可以使用这些方法实时检测数据漂移吗?(例如:请求进入我的模型 API,然后进行预测。然后我获取特征并将其传递给计算漂移的函数)
我的一些担忧是我需要完整的训练数据来比较吗?据我了解,这些算法需要相同大小的数据进行比较,那么我是否需要与我的训练数据大小相同的数据集?甚至了解用于检测数据漂移、概念漂移和协变量偏移的输入是有帮助的。