非线性噪声数据的成本函数

数据挖掘 机器学习 梯度下降
2022-02-18 10:38:35

我很想知道是否可以在一组数据点上使用成本函数来找到任何给定数据集的“最优最小值”解决方案。

我知道对于按照直线回归线对称聚集的一组常规数据很容易找到合适的成本函数

例子:

线性模型

但是如果数据形成一个时髦的形状,比如 x^2 或 3*x^3 等等……

如您所见,第二张图比第一张图嘈杂得多。

二次模型 x^2

那你怎么办?它是相同的过程还是不同?你能找到任何一组数据点的最佳最小值吗?

我知道成本函数正在使用残差来形成最佳拟合,但我只是好奇它是否可以处理任何数据集。

1个回答

我认为第二张图片不一定有更多的噪点,它只是比第一张的线性度低。如果您正在做回归(在您的两个问题中都是这种情况),您可以使用相同的损失函数来优化您用来拟合数据的函数系列。唯一的区别是,对于某些函数族,梯度下降可能无法达到全局最优,但会陷入局部最优。损失函数仅决定如何惩罚某些错误(基于残差)。