“训练补丁大小”是什么意思?

数据挖掘 美国有线电视新闻网 自动编码器 卷积
2022-02-13 02:09:51

目前我读了一篇关于自动编码器(链接的对称跳过连接的论文。其中一项实验改变了“训练补丁大小”。

在我的理解中,补丁是在卷积层一次使用的图像的子框。因此,如果您有一个 3x3 过滤器,则补丁是大小为 3x3 的图像的一部分。

他们的意思是“训练补丁大小”是输入图像的大小吗?(网络是一个对称的自动编码器,所以输入大小是任意的)

提前致谢

1个回答

如果你按照链接的文献(在兔子洞里走几层),你最终会看到 Kervann 和 Boulanger 2005 年的一篇论文 ——至少这是我得到的深度。

在那个链接的网页中,他们定义了基于补丁的图像降噪方法:

主要思想是将自适应邻域内的数据点的加权和与每个像素相关联。

所以一个补丁是单个图像的一个区域,就像一个卷积核,但它不卷积

他们谈论自适应补丁,这意味着您需要(可能是随机)选择一个像素,然后调整使用的补丁大小,以便包含足够的周围信息来重现同质补丁作为输出。

似乎使用添加了噪声(加性高斯白噪声)的干净图像进行训练。这将通过减少方差来帮助提高最终模型的鲁棒性,但这样做也必须引入偏差来重新创建噪声以某种方式均匀的区域。如果向下滚动,上面的第一个链接显示了许多要降噪的典型图像示例。噪音并不总是那么均匀。

这是一张取自 2005 年论文的照片,其中显示了补丁区域(标记为黄色)。第 5 页对总体思路进行了很好的简短描述。他们工作中的补丁大小通常是7x7或者9x9在像素大小。

噪声图像上的补丁示例