选择 CNN 的层超参数

数据挖掘 机器学习 神经网络 深度学习 分类 美国有线电视新闻网
2022-02-19 03:52:57

背景:我正在构建一个 CNNMATLAB来对壁纸组进行分类。

我正在使用以下网络类型。

CONV -> ReLU -> POOL -> CONV -> ReLU -> POOL -> FC -> DROPOUT -> FC -> SOFTMAX

第一个 CONV 或 POOL 层的参数是否应该与后面的第二个(或以后)CONV 或 POOL 层相同?如果没有,是否有一种有意义的方法来为重复的后续层选择参数?

例如,对于第一个 CONV 层,您可以选择 5x5 过滤器。也许对于第二个 CONV 层,选择某个不同大小的过滤器更有意义?

1个回答

找到合适的架构在某种程度上是可行的。您正在谈论的那些超参数可能会有所不同。尝试使用基础架构,然后训练您的模型。如果它不学习您的模型,请尝试更改超参数。找到一个好的模型是一个迭代操作。有很多争论,但对于在CNNs. 你可以想,如果你的模型不学习你的数据,它需要更多的特征来学习CNN层的行为不知何故如下:

最大池化

它用于为其层的输入添加空间不变性。它还用于减小输入大小。通过增加其大小,上述两种行为会增加。

卷积层

这些层用于提取特征以降低成本函数以学习数据。如果你增加这些层的大小,它们的行为会更广泛,它们会发现更大区域的特征。

看看这里这里