我需要优化集成地震波传播方程组的 3D 求解器的性能。不出所料,实现有限差分模板计算的函数是计算的瓶颈。
我读了这篇文章,在第 3.2 节中,作者说寄存器阻塞允许他们获得 3D 模板计算的显着加速。
我不明白如何实现这种技术。是否可以在某处以明确的形式找到寄存器阻塞的描述?
我需要优化集成地震波传播方程组的 3D 求解器的性能。不出所料,实现有限差分模板计算的函数是计算的瓶颈。
我读了这篇文章,在第 3.2 节中,作者说寄存器阻塞允许他们获得 3D 模板计算的显着加速。
我不明白如何实现这种技术。是否可以在某处以明确的形式找到寄存器阻塞的描述?