我正在使用以 Resnet50 作为基础模型(在 Keras 中)(例如 A 类和 B 类)的迁移学习来解决图像分类问题。
这种分类涉及时间因素。例如,我需要足够的证据来从一个班级过渡到另一个班级。
因此,我想到的一个实现平滑过渡的想法是将 LSTM 层添加到 CNN 层(CNN+LSTM)。
在理解以下查询时需要您的帮助。
有什么方法可以将 LSTM 层添加到迁移学习过程中(假设 CNN 层权重不可训练)
我需要如何准备数据集(图像帧)。例如,我为 A 类和 B 类各有 10 个视频。我是否需要按照视频中的顺序保持图像的顺序。(到目前为止,对于正常的图像分类,我已经打乱了图像帧)
关于构建我自己的 CNN + LSTM 模型的任何想法。
参考链接对于 2 和 3 来说非常有用。
是否需要更新视频中的图像帧?
请对此进行任何更新。
谢谢你,深家伙