例如转换任务,模型只包含卷积层和池化层,输入图像,输出特征图(损失 MSE,试图生成与标签中的特征图完全匹配的特征图)
前向传递可以采用任何图像大小并输出大小 = [w/(n_max_pooling*2), h/(n_max_pooling*2)] 的特征
因此,批量大小为 1时,当我们输入不同的图像大小、不同的比例时,不会出现“尺寸不匹配错误”。由于卷积层和最大池化层的性质,网络只输出一个特征图。
例如:(batch_size、通道、宽度、高度)
- 样本 1:1x3x128x128 => 目标 64x64
- 示例 2:1x3x768x1024 => 目标 368x512
……
我想知道在输入形状不一致的情况下,网络是否能够正确训练和更新它的权重?