我试图理解卷积神经网络,尤其是它的参数。我在互联网上找到了几个公式,但我无法理解它们。例如:
((filter_size*filter_size)*stride+1)*filters)
这里的过滤器数量是多少?这是否意味着,我们size*size
为我们所做的每一步训练不同的权重,并且步长的总数将是过滤器的数量?
我试图理解卷积神经网络,尤其是它的参数。我在互联网上找到了几个公式,但我无法理解它们。例如:
((filter_size*filter_size)*stride+1)*filters)
这里的过滤器数量是多少?这是否意味着,我们size*size
为我们所做的每一步训练不同的权重,并且步长的总数将是过滤器的数量?
卷积层由称为过滤器(或内核)的数字网格组成。这是扫描图像的过滤器(这里讨论 2D 卷积)。应用意味着简单地将过滤器的每个像素的值与图像的相应值相乘。有关将滤镜应用于图像的过程的直观说明,请查看此视频。
步幅是指过滤器每次应用之间的像素数。为此,我还将参考上面的视频。如果我们有一个 5x5 的图像和 3x3 的滤镜;stride = 1
指在图像中的 25 个像素中的每个像素上居中过滤器。stride = 2
另一方面,在每一步跳过以像素为中心。查看此视频以获取有关 stride 的视觉解释。
将过滤器应用于整个图像完成过滤器的处理。但通常,我们在每一层都有多个过滤器来捕获不同的特征,这意味着对不同的过滤器再次应用上述过程。
对于 5x5 图像,过滤器大小可以是 1x1 到 5x5 之间的任何值。1x1 有点无意义,但仍有可能。