移动网络分辨率乘数的内部工作原理 - 它有什么作用?

数据挖掘 机器学习 机器学习模型 卷积 图片大小 图片
2022-03-17 00:24:49

我对 Mobile Net 的分辨率参数的工作方式有疑问。文章本身和有关该主题的博客文章(12)中,我无法找到我的问题的答案。据说“分辨率乘数改变了图像的输入尺寸,减少了每一层的内部表示”。这是否意味着它(参数):

A) 将每个图像分解为例如各自的 224x224 位像素子图像,网络在这些子图像上运行其卷积?

或者

B) 例如,从图像的中间获取一个 224x224 像素切片,网络在其上运行卷积?

或者

C) 将原始图像压缩成自身的 224x224 像素表示,网络在其上运行其卷积?

1个回答

我联系了移动网络架构和论文的作者,他们给了我以下答案:

乘法器完成了 C) 中所阐述的内容:它充当原始输入图像的重新缩放以适应参数指定的值。默认图像大小为 224x244,对应于分辨率乘数 1.0。因此 112x112 输入图像分辨率对应于 0.5 分辨率乘数,只需将图像缩小到 112x112 即可实现。从技术上讲,我们缩放较小的一侧以定位和裁剪其他尺寸。

我希望这对其他人和我一样有帮助。