假设我有一个时间序列数据,我想在 $x$ 和 $Time$ 上对 $y$ 进行回归。有关数据集,请参见下文。 on and . See below for the dataset.
y x time
12 100 1
14 101 2
16 102 3
18 103 4
20 201 1
22 202 2
24 203 3
26 204 4
方法一:
一种方法是通过将时间视为序数 (?) 或连续变量,直接在上述数据集上执行多元线性回归或神经网络或 SVM。我可以按如下方式进行时间序列回归:
其中 $\varepsilon$ 被建模为 ARMA is modeled as ARMA
方法二:
或者,我可以重新排列数据并为时间创建虚拟变量,如下所示:
y x Time_1 Time_2 Time_3
12 100 1 0 0
14 101 0 1 0
16 102 0 0 1
18 103 0 0 0
20 201 1 0 0
22 202 0 1 0
24 203 0 0 1
26 204 0 0 0
并进行时间序列回归/神经网络/SVM。例如,时间序列将是
其中 $\varepsilon$ 被建模为 ARMA。 is modeled as ARMA.
以下是我的问题:
- 什么是正确的方法 - 1 或 2?
- 如果我们使用诸如神经网络或 svm 之类的数据挖掘方法,我们使用方法 1 还是方法 2 是否重要?
- 方法 1 是否更简洁,因为我们有 1 个表示时间的变量,而方法 2 有 3 个变量?