给定一个 CNN,比如 AlexNet:
如何将第三个 conv 块的内核位置(即 13x13 滤波器大小)与输入图像相关联。这是否会根据输入图像给出有意义的表示。
我正在考虑只是对位置进行上采样,从 13x13 到 224x224。