哪种方法更合适?训练数据过度拟合或准确性低?

数据挖掘 深度学习 喀拉斯 词嵌入 过拟合
2021-09-18 23:20:16

最近,我使用 Keras 在嵌入数据后测试了两种方法。

  1. 嵌入后的卷积
  2. 嵌入后的最大池化

第一种方法的损失和验证损失是这样的, 在此处输入图像描述

第二种方法的损失和验证损失是 在此处输入图像描述

如您所见,第一个方法大大减少了训练数据的损失,但在验证集中损失显着增加。

第二种方法对训练数据的损失比第一种方法高,但训练数据和验证数据的损失几乎相同。

哪种方法更适合使用附加变量进行进一步分析?

1个回答

样本内数据的表现几乎不算数。样本外数据的表现更能说明你应该如何期望你的模型在未来的输入上表现。

第二个模型具有更好的样本外性能。仅凭这些信息,我更喜欢第二种模型。