我该如何解决这个“凸”问题?只是过拟合的问题吗?

数据挖掘 机器学习 监督学习 评估 正则化 过拟合
2022-02-23 13:34:11

我在训练模型时获得了一些关于验证数据的指标,就我而言,它们是:

(0.25, 0.31, 0.46, 0.57, 0.65, 0.75, 0.77, 0.78, 0.84, 0.84, 0.85, 0.84, 0.84, 0.84, 0.82, 0.8, 0.8, 0.79, 0.78, 0.77, 0.75, 0.77, 0.75, 73, 0.7.7 , 0.73, 0.73, 0.73, 0.73, 0.73)

他们可以这样描述:

在此处输入图像描述

在我看来,理想的结果应该是: 在此处输入图像描述

是不是过拟合的问题

不幸的是,我尝试了几次改变常规系数以避免过度拟合,并调整学习率系数以减慢速度,但仍然是“凸”的。

我怎样才能达到上面显示的理想结果

如果有人能给我一些建设性的建议,将不胜感激?

1个回答

是的,你看到的是一个典型的过拟合案例。

您说您使用线性模型,例如逻辑回归。为了对这些类型的模型进行正则化,通常会应用 L1 和/或 L2 正则化。L1 正则化很简单||W||1L2 是||W||22通常。

另一种方法是通过特定的方式更改模型的标签,这是我创建的一种正则化方法(无耻插件)。这是论文的链接:https ://arxiv.org/abs/1609.06693

希望这可以帮助。