我正在使用使用 keras 构建的完全连接的前馈神经网络进行文本分类。它由3个隐藏层组成。我计划在每个隐藏层之后添加一个 dropout 层以防止过度拟合。在调整辍学率时,我将值从 0.2 -> 0.3 -> 0.4 -> 0.5 增加。
我想知道是否应该增加训练数据的大小以进行更准确的比较。我的意思是假设我有 100 万大小的训练数据,辍学率为 0.2。我是否应该将训练数据量增加到 150 万以实现 0.3 的辍学率?
计算:
1000000 * 0.8 * 0.8 * 0.8 = 512000(辍学率0.2)
1500000 * 0.7 * 0.7 * 0.7 = 514500(辍学率0.3)