我在阅读Deepmind 在 Sec 3.1 的最后一段中关于 Spatial Transformers的原始论文时遇到了这一行:
定位网络函数 floc() 可以采用任何形式,例如全连接网络或卷积网络,但应包括最终回归层以产生转换参数 θ。
我明白什么是回归,但回归层是什么意思?
我在阅读Deepmind 在 Sec 3.1 的最后一段中关于 Spatial Transformers的原始论文时遇到了这一行:
定位网络函数 floc() 可以采用任何形式,例如全连接网络或卷积网络,但应包括最终回归层以产生转换参数 θ。
我明白什么是回归,但回归层是什么意思?
基本上,这意味着“定位网络”应该输出一组实值参数(通常为 6 个数字)。“回归”这个词没有任何特定的含义。
任何依赖原始图像作为输入(直接或间接)并输出 6 个数字的网络都可以工作。并且它的最后一层将有资格作为“回归层”,只要它不受实际域的限制(未归一化、softmaxed 等)