Intel Knights Landing 工作负载与 NVIDIA GeForce

计算科学 并行计算 高性能计算
2021-11-24 09:39:57

关于新推出的英特尔至强融核将如何从竞争对手手中夺取 HPC\超级计算机市场份额的文章很多。Intel Knights 配备 72 核和 4 个插槽,使其成为 288 核系统。而单个 Gtx980 有 2048 个 CUDA 内核。这两者在计算能力方面如何竞争(看起来GTX遥遥领先)?或者他们是否针对完全不同的工作负载,在这种情况下有哪些例子?

谢谢。

2个回答

正如 Brian 所说,Xeon Phi 内核根本无法与 CUDA 内核相提并论。Phi 的问题在于它介于两匹马之间。

如果您在进行高度并行的浮点计算,NVIDIA 将以 1/4 的价格为您提供大约 3 倍的性能。对于双精度,差距更小,但对于相同的性能,NVIDIA 最终仍然便宜 20%。

如果您的问题很难并行化,那么 Phi 根本无法帮助您,相反,英特尔至强之类的东西将为您提供最佳性能。

Phi 的最佳点是高度并行但不同的东西,即每个线程必须做不同的事情。一个例子是蒙特卡洛模拟。例如,它们用于模拟放射治疗,其中 GPU 仅比标准 CPU 提供小的(~2 倍)加速。

英特尔还试图出售 Xeon Phi,因为您只需要最低限度地重写代码。然而,对于任何不重要的并行化,工作变得与 GPU 相同。

CUDA 内核根本无法与 Xeon Phi 协处理器中的独立处理器内核相提并论。Phi 协处理器内核是成熟的处理器,可以有自己的循环、分支等,而 CUDA 内核都在数据的各个切片上执行相同的操作。