如何解决这个回归问题?

数据挖掘 回归 线性回归
2022-02-25 23:29:47

我有一个多变量回归问题,它基本上在 3D 空间中形成一个平面。可能还有其他自变量在起作用,但如果我可以用 2 个自变量解决问题,那么我应该能够扩展以包含其余变量。

从广义上讲,这是一个资源问题。我有一个必需的资源 (z),这取决于时间 (x) 和注册用户数 (y)。注册用户是时间的函数,但我需要时间组件,因为一天中不同时间的资源需求不同。如果我们的用户继续以已知速率注册,我希望能够预测一天中给定时间的资源需求。

这是数据图表:

所需资源作为日期和注册用户数量的函数。

这显然不是线性回归问题,那么我该如何处理呢?

2个回答

如果要进行预测,则需要行为的基础模型。然后您可以执行最小二乘拟合以确定模型参数。线性回归只是假设您具有线性关系并根据该关系进行预测 - 它没有什么神奇之处,除了模型简单且通常有效。多项式回归在外推时会产生不良行为,所以我不建议这样做。

构建模型函数通常是一个反复试验的过程(除非您对系统有一些先验知识,我猜您没有)。我建议查看最大化(x, y)点的轨迹。z看起来它们具有指数衰减关系。像这样的模型y = exp(-x/x0)可能会非常接近地拟合数据。从数据中确定 x0 的值后,您可以为z.

将问题重新定义为时间序列给定一定程度的“y”,随着时间的推移预测“z”。