我有一个简单的回归模型(y = param1*x1 + param2*x2)。当我将模型拟合到我的数据时,我找到了两个很好的解决方案:
解决方案 A,params=(2,7),在RMSE=2.5的训练集上最好
但!当我进行交叉验证时,解决方案 B params=(24,20) 在验证集上大获全胜。
解决方案 A 被糟糕的解决方案包围。因此,当我使用解决方案 A 时,模型对数据变化更加敏感。
解决方案 B 周围环绕着 OK 解决方案,因此它对数据的变化不太敏感。
这是我刚刚发明的全新理论,即具有好邻居的解决方案不会过度拟合吗?:))
是否有通用的优化方法可以帮助我支持解决方案 B,而不是解决方案 A?
帮助!