面板(纵向)数据的机器学习方法

数据挖掘 机器学习 神经网络 数据
2021-10-14 05:51:53

我有一个面板数据集,例如:

obj  time        Y       x1      x2
1    1         0.1     1.28    0.02 
2    1        0.11     1.27    0.01   
1    2        -0.4     1.05    -0.06  
2    2        -0.3     1.11    -0.02   
1    3        -0.5     1.22    -0.06  
2    3        1.2      1.06    0.11    

我是 ML 的新手,直到最近我才知道这是一种特殊的(面板)数据类型。我预测了一个变量的值Y(t+1)按价值观x1(t)x2(t)(时间滞后)使用线性回归模型和 MLP。但是现在看了一些面板数据分析的资料,发现我用的方法不合适。目前我发现固定/随机效应模型适用于面板数据分析。所以,我有几个问题:

  1. 还有哪些其他方法可以正确用于分析面板数据(我对神经网络模型感兴趣)?我读到这些方法必须考虑特定对象值与该对象先前出现的值之间的依赖关系(具有固定和随机效应的模型中的内容)。

  2. 我还尝试通过向其提供 2D 数据来使用 MLP。我将面板数据分为k=time quants count 2D 块并将此数据传递给 MLP 输入。例如上面,k=3, (input layer size=4=number of predictorsblock objects count)。在这种情况下batch size=1. 如果我做batch size=2并为神经网络提供一维数据(input layer size=2例如上面,会有什么不同吗?在这两种情况下,神经网络的权重将在所有对象的观察在一个时间量内传输后重建。

1个回答

面板数据 = 多对象时间序列。

换句话说,对于您尝试预测的不同对象(obj)(Y ),您有时间序列问题( time)。

如果我是你,我会剖析这个问题并开始考虑时间序列 + 另一个名为obj的判别列。你知道那里有哪些方法?这是一个非常酷和现代的时间序列教程,看看吧

关于NN,你为什么要这么努力地挤进去?让数据告诉你什么算法可以对其进行建模。就个人而言,考虑到这 3 个功能,NN 实在是太多了,您可以使用一些更简单/更便宜的方法以更简单的方式获得类似的结果。