例如,在VGG/OxfordNet中,最终分类层之前的全连接(密集)层的大小为 4096。
同样,在AlexNet
...网络剩余层中的神经元数量由253,440–186,624–64,896–64,896–43,264–4096–4096 –1000 给出。
我的问题是在密集层中使用这个特定数量的神经元的基本原理是什么?
我还没有找到令人满意的解释,因为上述每个示例都使用不同的分辨率图像和不同数量的内核和内核大小,从而生成不同数量的参数——但不管使用相似的密集层。
即使这纯粹是经验性的,我也很想听听您对如何决定的想法。