我正在使用一个程序,该程序利用 PARDISO 求解器作为英特尔数学内核库的一部分。我目前正在决定在一台新计算机上运行模拟。关于该程序的基准测试如何跨系统传输,我有一两个问题。
我当前的机器在 2.3GHz 下运行较旧的双四核至强 (E5345),在 2 个通道中运行 DDR2 RAM 在 667 MHz。在这个系统上,使用 8 个线程运行,内存中的程序绑定了小案例(3000 个左右,大约是通常大小的 1/3),运行在 CPU 上限的 3/4 左右,而较大的案例在 1/2 左右触底cpu 上限。在购买新系统之前,我没有任何方法可以在更具代表性的系统上对其进行基准测试。
我可以很容易地在我当前机器上的 1、2、4 和 8 核的较小情况下对我的代码进行基准测试,这就是我目前正在做的事情。我将使用该信息来决定未来计算机中速度较慢的内核还是较慢的内核。问题是,在进入新计算机时,将升级到 1333 MHz、4 个通道和沙桥架构的 RAM。我听说 Sandy Bridge 架构在内存吞吐量基准测试中非常强大,但无法找到任何将其与旧架构进行比较的基准测试。
当我升级到具有更快 RAM 和架构的 12 或 16 个具有可比时钟速度的内核时,我是否有任何理由期望我的模型从内存限制变为 CPU 限制?我知道由于求解器性能对模型的高度依赖性,这可能很难回答,但我希望有人有跨架构基准测试的经验,并且可以对预期的结果提供一些见解。