用于多变量时间数据的多层神经网络

机器算法验证 时间序列 神经网络
2022-03-18 18:04:16

我正在寻找一种从多元时间数据(例如,多通道录音)中建模和提取特征的方法。

我对 RBM、稀疏自动编码器等深度学习方法特别感兴趣。

我遇到的大多数方法只考虑数据的一维,或者可能是数据(通常是图像)中的二维“块”。

我找不到一篇关于如何考虑时间方面和多变量方面的论文。例如,如果我正在从多个通道录制音频,那么我知道这些通道可能在某种程度上是相关的。此外,由于它是一个不断发展的时间信号,因此每个样本与之前的样本之间也存在一些相关性。

有没有办法将这些多元时间约束合并到网络中?

我正在寻找有关使用多通道结构的多变量时间方法的具体论文。

谢谢。

3个回答

Hinton 等人有多篇论文。它处理时间数据和音频(http://www.cs.toronto.edu/~hinton/papers.html)。例如:

  • 使用深度信念网络进行声学建模,2012 年。
  • 使用受限玻尔兹曼机学习更好的语音声波表示,2011。
  • Deep Belief Networks using Discriminative Features for Phone Recognition, 2011. The Recurrent Temporal Restricted Boltzmann Machine, 2009.
  • 用于建模运动风格的分解条件受限玻尔兹曼机,2009 年。

我还没有阅读最近的论文,但 2009 年的论文应该让您很好地了解如何使用 RBM 和 DBN 对时间数据进行建模。

我也同意 Ran,大多数深度学习技术都是用图像数据集测试的。请查看这篇研究论文,它讨论了使用深度学习技术进行音频分类。

我还不能发表评论,但我有以下评论。

对于多变量数据,我通常会想到不同“类型”的数据,例如布尔、多选或浮点数据的混合(这里称为混合变量)。正如我所看到的,不同音频信号的输入因此不是多变量的,而是多维的,因为您可能对所有通道都有相同的数据类型(实值数据)。

我认为大多数基本的 RNN 都可以处理高维时间序列。参见例如这里

也许以上两个链接的组合将导致一个合理的算法。