我构建了一个 CNN 来学习对 EEG 数据进行分类(只有大约 4000 个训练样例,2 个类,50-50 个类平衡)。每个训练样例为 64x512,每个有 5 个通道
我试图使网络尽可能简单/小以进行测试:
- 卷积层(4 个过滤器)
- 最大池
- 辍学 50%
- 全连接(50 个神经元)
- 辍学 50%
- 软最大
我也使用权重衰减(L2 reg,lambda = 0.001)
问题是无论我如何使用过滤器参数(大小、步幅、数量),我的网络都会过度拟合。它 100% 符合训练数据,但无论我做什么,我都无法获得超过 65% 的测试准确率。
为什么这么小的网络会过拟合?我认为这是样本量的问题,但我已经阅读了许多关于 EEG 和 BCI 的研究论文,它们的样本量有时甚至比我还小
还可以做些什么来规范 CNN?