二进制 CNN 的理想大小是多少?我的数据集足够长吗?

数据挖掘 机器学习 神经网络 喀拉斯 张量流 图像分类
2022-02-27 19:23:10

我想知道 CNN 的理想大小是多少,或者有一个数学函数来确定它,或者它会随着不同的范围而变化?

而且,我正在做一个二进制分类 CNN,每个类有 700 张图像(总共 - 1400 张)。是不是太小了?我怎么能说它很小呢?

注意:我的 cnn 准确率为 83%。

2个回答

没有能够将模型大小和性能联系起来的数学函数。

神经网络的架构(过滤器大小、激活、深度、权重初始化)可以被认为是超参数,因此要改进您的模型,您需要采用超参数调整方法。

改进模型的另一种方法是在您的架构中试验最先进的功能。我相信你的数据集足够小给你很大的实验空间(因为据说训练时间很快)。

如前所述,没有办法找到神经网络的理想大小。它还取决于您使用的图层类型,而不仅仅是数据集的大小。但我认为可训练参数的数量至少应该小于数据集的大小(我的意思是示例数 x 特征数)。找到一个可行的架构可能是最佳实践 - 猜测比纯粹的机会更好,然后添加或删除层/神经元以达到最佳参数数量。

另一种认为它很小的方法是使用另一个更大的数据集,用于图像分类并比较同一网络上的结果。例如,您可以尝试猫和狗您可以找到有关此数据集的几篇教程,包括Sentdex的一篇。

如果您正在进行图像分类,我强烈建议您研究迁移学习有几个预训练的神经网络在大型数据集上训练了很长时间。只需很少的培训,您就可以轻松实现超过 %95 的准确度。