验证损失与训练损失不同

数据挖掘 神经网络 情绪分析 迁移学习
2022-03-04 03:32:02

我使用 XLNET 作为情绪分类器来确定评论是正面的还是负面的。我能够取得好成绩

在此处输入图像描述

但是当我绘制验证和训练损失时,我看到了这一点

在此处输入图像描述

我认为这意味着模型过度拟合?但我不太确定。如果有任何建议,我将不胜感激。

1个回答

这种过度拟合在微调大型 LM 时很典型。

“避免”它的常用方法是:

  • 提前停止:选择具有最佳验证损失的检查点。
  • 随机重启:从头开始训练多次,选择验证性能最好的模型。