训练具有时间和非时间属性的 LSTM/任何其他深度学习模型

数据挖掘 神经网络 深度学习 预测建模 lstm rnn
2022-02-17 13:53:27

我正在开展一个项目,根据文件系统过去 6 个月的元数据。我有以下关于文件的属性:

  1. 过去 6 个月文件使用的时间顺序(无论何时读取/写入/修改文件以及由谁)。
  2. 所有在服务器上并且可以访问文件的用户。
  3. 最后修改/写入/读取的纪元时间和由谁。
  4. 文件创建纪元时间和由谁创建。
  5. 文件的任何合规性规定(文件是否包含任何机密数据)。
  6. 文件的大小、名称、扩展名、版本、类型。
  7. 可以访问文件的用户数。
  8. 文件路径。
  9. 访问的总次数。
  10. 允许的用户。

现在,我打算使用 LSTM,但对于标准 LSTM,输入只是时间序列。但是,我所拥有的所有属性在预测文件的未来使用方面似乎都很重要。

  • 我还应该如何利用我拥有的文件的属性?
  • 我是否应该训练前馈神经网络,而不考虑它通常在时间序列上失败的事实?
  • 我应该如何进行?
  • 是否存在可以考虑文件属性并预测文件在不久的将来使用情况的 LSTM 变体?
  • 我是否需要像混合使用 MLP 和 LSTM 一样?
1个回答

就像你说的,你可以使用像 LSTM 这样的循环网络来处理你的时间数据。我建议你简单地将你的其他特征连接到 LSTM 的输出(return_sequence = False)。然后添加一些密集层(1 层就足够了):这将输出属于您的类的概率。