我正在尝试编写一个循环神经网络 (LSTM) 以在 python 中创建音乐,并且正在考虑使用多个功能而不是仅将音符音高作为网络的输入。最初我只有音符音高,所以它通过 one-hot 编码输入到网络中。我要添加的另外两个功能是音符持续时间和音符之间的偏移量。应该如何组织输入向量,以便所有数据都通过网络馈送?
我已经尝试将所有数据组合成一个长向量,其中所有 3 个特征都进行一次热编码然后连接,但这导致输出变为“NaN”。任何帮助,将不胜感激。
链接我的代码要点:
https://gist.github.com/treutm/1b1f49e3d0a9de53cd67c136292f329f