在线可用的 CPU 基准测试主要关注桌面应用程序/游戏,很少关注串行/并行数值内核,特别是稀疏内核(例如 MatMult)。一些基准测试,如 NAS/SciMark 存在,但很少被流行的基准测试站点在最新/最好的 CPU 上使用。
当涉及使用稀疏/密集数值库(如 PETSc/ScaLAPACK)的代码时,如何决定购买/使用哪台机器来实现多核性能?例如,我最好使用 AMD FX8350 或 Intel Core i7-3770K 作为我的桌面,或者我应该请求在基于 Xeon 或 Opteron 的集群上分配,特别是对于中小型(即少于 4000 个内核)类型的作业,其中一个有更多选择。
我从个人经验中知道,英特尔芯片在过去几年中的表现要好得多,但最新的 AMD 产品呢?
编辑:我对 PETSc 的 MatMult 内核(用于非结构化 FE 矩阵)特别感兴趣,有人告诉我它是内存绑定的。我认为使用所有内核的峰值 FLOPS 百分比性能会很有用。