在有关深度学习的研究论文中,您通常会得到关于每一层如何运作的解释。
例如在 SRCNN,一个图像放大模型(https://arxiv.org/pdf/1501.00092.pdf),第一层提取补丁,第二层学习从低分辨率补丁到高分辨率补丁的非线性映射,第 3 层将高分辨率补丁重建为完整的高分辨率图像。
我的问题是如何推断每一层的作用?我很好地理解模型的代码(我认为)并且理解它们的超参数是什么,但我不知道如何为另一个网络架构生成像上面这样的图像。
有没有我可以遵循的程序来解决这些问题?和/或我只需要更好的数学理解?
谢谢。
编辑回答中引用的后续问题:
仅仅是研究人员在开始编码之前对每一层都有一个目标吗?还是你需要通过实验找出来(比如打印每一层的输出来看看它到底做了什么)?
