我在类似形式的数据中遇到了一些实际问题:item*features*time.
传统上,教科书中预测模型的数据只有item*features,我们使用特征来进行预测。项目通常是 iid。
起初我对这种()数据感到困惑,item*features*time直到有人告诉我这被称为面板数据。这提醒我,我在一些计量经济学书籍中看到了这个概念。然而,大多数计量经济学都是线性模型。
鉴于我们今天有大量的预测模型(如 LASSO、RT、GBM、SVM,甚至深度学习),我的问题是有没有办法为面板数据构建预测模型?有没有好的参考资料?
数据的一些实际事实:
它不是独立同分布的,所以更接近时间的观察可能有一些相关性,或者一些关系,我们可以在预测模型中使用它们。此外,有时,项目是相关的,项目之间的关系可能也需要考虑。
我可以强制将这个 3-D 数据变成 2-D,通过融化
item*features为一个长观察,使数据变成observation*features传统教科书形状的数据吗?请问这个结果对于这个好还是有意义?