我正在标记数据集上训练分类 CNN. 该网络在测试和验证集上达到 0.92% 的准确率。在这个过程之后,我通过一些过程对数据进行预处理,以模拟一些合理的条件并获得一个新的数据集具有相同的标签。此过程的一个示例是颜色域之间的转换,例如,和.
在我给出的示例中,如果使用丢失的颜色特征,该过程可能会降低网络的性能。就我而言,尽管数据可能会损坏,但不会丢失任何数据。申请后我正在训练一个性能下降的新网络,准确率仅为 0.81%。我猜测我正在经历概念漂移,尽管我不确定如何显示或可视化这一点。另外,我不知道如何修复 NN 中的概念漂移。
不幸的是,我无法透露我正在处理的确切案例。有没有办法分析或显示新域中的数据分布发生了变化?
我如何解决所描述的案例以及我可以做些什么来尝试提高性能(无论具体任务如何)?