我希望尝试使用一些生成模型生成经济时间序列数据(GDP、通货膨胀、失业等)。我正在考虑将它们与 LSTM 以及更多的 AR(p) 样式模型一起使用,所以我更喜欢生成长数据串的模型(即从 t = 0 到 t = 20 或其他东西的通货膨胀),但如果这不会产生好的结果,我猜它可能不会,我也可以使用 AR(p) 样式的结果(即输出只有 t = 0 和 t = 1)。
我正在考虑使用生成对抗网络 (GAN) 或深度信念网络 (DBN) 来生成我的数据,但我不确定我应该将研究重点放在哪个方面。我不需要的一件事是 GAN 擅长的用于图像生成的深度卷积层,而过度拟合时间序列的模型也是我想要避免的问题(经济时间序列在 50 个国家/地区可能有 5000 个观察值,所以GAN 可能必须非常浅)。另一方面,我读到受限玻尔兹曼机现在被认为是玩具模型(不确定是否也考虑 DBN)。也不确定 DBN 与 Real Valued Output 的性能。
如果您对我可以使用的其他类型的模型有其他建议,请务必告诉我。但是,我真的希望从机器学习的角度尽可能达到最先进的水平(考虑到我是一个拥有良好机器学习和神经网络经验的人,但不是拥有实验室和 30 年研究生成模型经验的教授) . 我也知道经济学家通常不会生成数据来提高模型性能,但这是一个研究项目,我想看看我是否可以通过一些生成的数据更好地提高模型性能(并希望了解因果关系)。
我知道这个问题可能是主观的,但也许有人可以解释 DBN 和 GAN 的优缺点。每个对我的问题有多大帮助。