任何比多项式回归更好的算法

机器算法验证 回归 机器学习 多重回归 非线性回归 多项式
2022-04-08 00:06:20

我试图通过我的数据拟合基线,但多项式回归还不够接近。我使用梯度下降来设置参数。

还有其他方法或算法可以让我更接近吗?我想让我的蓝色基线看起来更类似于红色的实际数据。

在此处输入图像描述

3个回答

看起来像一个具有非常强(且相当规律)的季节性的时间序列。如果你使用 R,你可能想看看函数 stl(),或者拟合一个基本的结构模型(一个简单的入口点函数是 StructTS(),否则有几个包可以为你提供更多的通用性和更好地控制你的模型想要适应)。

答案是启用了干预检测的 ARIMA 模型。干预检测将建议电平变化/本地时间趋势/季节性脉冲和有助于有效识别/稳健识别反映自回归记忆的 ARIMA 结构所需的脉冲。请以列格式发布您的数据并告知测量频率。在我看来,您可能正在尝试使用一个非常过时的过程,称为傅立叶(一种纯确定性结构,即没有自回归分量),它根据假设的结构拟合数据,但通常(几乎总是)不能提供一个好的数据的“解释”......因此是一张像你展示的那样的图片。提出问题的荣誉!

回应 w.huber 和其他人的评论.....:

澄清一点。干预检测 (ID) 和像日志这样的功率变换 (PT) 是变换的形式。ID 处理未指定确定性结构的调整值,而 PT 处理与期望值的解耦误差方差关系。整个想法是尽可能少地进行必要的改造,就像医生开出最少的治疗形式一样。正如@w.huber 正确指出的那样,在应用 PT 之前,您需要证明误差方差和期望值之间的依赖关系。您何时(以及为什么)应该记录(数字)分布的日志?可能会帮助你。

认为你有你的答案。

但要补充一点,记录您的数据可能很有用。然后考虑进行常规(d)和/或季节性(D)差分。结果系列应该更容易建模。我不相信 d/D 是必要的,但某种形式的转换可能是必要的。很难从图表中看出,但似乎波动率随着时间/线性趋势而增加。

建议的模型(由其他答案)将为您提供更好的预测和序列分解,但通过时间序列的一些转换,您通常可以拟合一个足够好的多项式。

更新:
(1)如下所述,尚不清楚波动性是否与水平成正比。如果是这样,日志转换很有帮助。否则可能不会。
(2) 平方根变换未得到充分利用,但在这些设置中通常也很有帮助。