我正在使用 Keras 的 LSTM(使用 Theano 背景)研究Seq2Seq 模型,我想并行化这些过程,因为即使是几 MB 的数据也需要几个小时的训练。
很明显,GPU 在并行化方面比 CPU 好得多。目前,我只有 CPU 可以使用。我可以访问 16 个 CPU(每个核心 2 个线程 X 每个插槽 4 个核心 X 2 个插槽)
从 Theano 中的多核支持文档中,我设法使用了单个套接字的所有四个内核。因此,基本上 CPU 的使用率为 400%,使用了 4 个 CPU,其余 12 个 CPU 仍未使用。我也如何利用它们。如果可以的话,也可以使用 Tensorflow 代替 Theano 背景。