我有一个非常小的数据集(40 个训练示例,10 个验证示例,120 个类),我使用 Keras 中的一个非常简单的模型(仅限批量标准化、展平和密集层)获得了非常高的准确度。
我的训练准确率为 94-95%,验证准确率为 76-78%。我知道它过度拟合,我已经尝试了一些东西。数据不是图像,所以我无法扩充数据。我也无法添加数据,因为它是一种特定类型。我使用了两个 0.5 级的 dropout 层,而且架构非常简单,所以我认为我无法降低架构的复杂性。如果有人喜欢,我可以粘贴模型。
我的问题是:是否存在验证准确度不能像训练准确度一样高的情况?是否存在基于数据集大小的限制?还是验证准确度总是可以匹配训练准确度,而网络只需要正确的参数?