查找变量之间的关系类型

数据挖掘 机器学习 r 数据挖掘 回归
2022-03-10 16:08:41

我有一些指标的时间序列数据。我知道哪个指标是响应变量和独立的。我需要在它们之间建立一个模型。这种关系可以是线性的、二次的、对数的、分段线性的、多重线性的等。基本上,它可以是任何东西。

我可以使用任何技术/属性来查找指标之间的关系并拟合模型吗?

现在,我已经在 R 中编写了一个蛮力脚本。
例如,我有一个依赖于 X1、X2 和 X2 的响应变量 A。

A = C1*f1(X1)+C2*f2(X2)+C3*f3(X3) 是我的模型。

我的脚本尝试了 f1、f2 和 f3 的所有可能组合。
通过组合,我的意思是我最初从所有线性开始,然后其中一个是二次的,然后是三次的,然后是对数的,等等。

我正在使用 lm()。

然后我选择具有最少 AIC 的模型作为我的最终模型。

这显然需要很长时间。

我绝对需要一种自动查找此模型的方法。

你能建议一个更好的方法来做到这一点吗?

2个回答

使用神经网络而不是线性模型怎么样?神经网络将更容易学习任意非线性关系。

我首先要确保我只有独立的特征(您可以轻松地仔细检查协方差矩阵并找出零奇异值)。然后,我会选择线性/逻辑回归/线性 SVM。如果它没有提供所需的性能,我会尝试内核 SVM。