处理器可以为 PMMM 处理的字数

计算科学 线性代数 块分解
2021-12-15 14:40:11

PMMM代表并行矩阵-矩阵乘法,本质上加速了两个矩阵的矩阵-矩阵乘法算法AB两种尺寸n以便C:=AB. 让我们说我们有4处理器,我想知道每个处理器存储了多少字。

据我所知,因为我们有4处理器然后我们可以转换A,B, 和C块矩阵。每个块矩阵有4子块,因为我们有4处理器所以处理器i应该存储将在矩阵的子块之间发生的矩阵乘法AB在哪里 (i=1,2,3,4)。现在每个子块必须有n2/4元素。以处理器1例如,我们有:

C1,1=A1,1B1,1+A1,2B2,1
我们可能会看到,我们应该总共有n2/4+4n2/4=5n2/4每个处理器的字数。我的断言正确吗?看起来获得的值是不合逻辑的,但让我们说n可以被4.

0个回答
没有发现任何回复~