我正在使用词嵌入 + CNN 方法测试 IMDB 情感分析任务的想法。尽管据称 TPU 的计算能力优于 GPU,但有什么可以解释有利于 GPU(每个 epoch 约 9 秒)与 TPU(约 17 秒/epoch)的计算时间的显着差异?
用于卷积神经网络 (NLP) 的 GPU 与 TPU
数据挖掘
词嵌入
显卡
2022-03-12 08:45:50
1个回答
我认为将通用 TPU 与通用 GPU 进行比较没有多大意义。就计算能力而言,低端 GPU 与市场上最好的 GPU 之间可能存在 10 倍或更大的差异。Google 自己开发了 3 代 TPU,每一代都比上一代更强大。
我没有跟上最新的发展,但最后我意识到,TPU 不一定在所有方面都优于 GPU。它们可能会提供更多的每瓦计算,但这与每单位计算或每美元计算不同。
更具体的架构细节,谷歌有它自己的文档,关于 TPU 到底擅长什么类型的计算,以及什么更适合 GPU。
其它你可能感兴趣的问题