数据挖掘 - 训练具有时间和非时间属性的 LSTM/任何其他深度学习模型 - 吾爱随笔录 - 问答

训练具有时间和非时间属性的 LSTM/任何其他深度学习模型

数据挖掘神经网络深度学习预测建模 lstm rnn

2022-02-17 13:53:27

我正在开展一个项目，根据文件系统过去 6 个月的元数据。我有以下关于文件的属性：

过去 6 个月文件使用的时间顺序（无论何时读取/写入/修改文件以及由谁）。
所有在服务器上并且可以访问文件的用户。
最后修改/写入/读取的纪元时间和由谁。
文件创建纪元时间和由谁创建。
文件的任何合规性规定（文件是否包含任何机密数据）。
文件的大小、名称、扩展名、版本、类型。
可以访问文件的用户数。
文件路径。
访问的总次数。
允许的用户。

现在，我打算使用 LSTM，但对于标准 LSTM，输入只是时间序列。但是，我所拥有的所有属性在预测文件的未来使用方面似乎都很重要。

我还应该如何利用我拥有的文件的属性？
我是否应该训练前馈神经网络，而不考虑它通常在时间序列上失败的事实？
我应该如何进行？
是否存在可以考虑文件属性并预测文件在不久的将来使用情况的 LSTM 变体？
我是否需要像混合使用 MLP 和 LSTM 一样？

1个回答

就像你说的，你可以使用像 LSTM 这样的循环网络来处理你的时间数据。我建议你简单地将你的其他特征连接到 LSTM 的输出（return_sequence = False）。然后添加一些密集层（1 层就足够了）：这将输出属于您的类的概率。

其它你可能感兴趣的问题

上一篇如果两个不同的数据点之间存在关系，如何训练机器学习模型？下一篇为什么我的随机森林中只有 3-4 个特征很重要？