如何为 3D 有限差分模板计算实现寄存器阻塞

计算科学 有限差分 高性能计算 3d
2021-12-01 19:51:20

我需要优化集成地震波传播方程组的 3D 求解器的性能。不出所料,实现有限差分模板计算的函数是计算的瓶颈。

我读了这篇文章,在第 3.2 节中,作者说寄存器阻塞允许他们获得 3D 模板计算的显着加速。

我不明白如何实现这种技术。是否可以在某处以明确的形式找到寄存器阻塞的描述?

0个回答
没有发现任何回复~