PMMM代表并行矩阵-矩阵乘法,本质上加速了两个矩阵的矩阵-矩阵乘法算法和两种尺寸以便. 让我们说我们有处理器,我想知道每个处理器存储了多少字。
据我所知,因为我们有处理器然后我们可以转换, 和块矩阵。每个块矩阵有子块,因为我们有处理器所以处理器应该存储将在矩阵的子块之间发生的矩阵乘法和在哪里 ()。现在每个子块必须有元素。以处理器例如,我们有:
我们可能会看到,我们应该总共有每个处理器的字数。我的断言正确吗?看起来获得的值是不合逻辑的,但让我们说可以被.
PMMM代表并行矩阵-矩阵乘法,本质上加速了两个矩阵的矩阵-矩阵乘法算法和两种尺寸以便. 让我们说我们有处理器,我想知道每个处理器存储了多少字。
据我所知,因为我们有处理器然后我们可以转换, 和块矩阵。每个块矩阵有子块,因为我们有处理器所以处理器应该存储将在矩阵的子块之间发生的矩阵乘法和在哪里 ()。现在每个子块必须有元素。以处理器例如,我们有:
我们可能会看到,我们应该总共有每个处理器的字数。我的断言正确吗?看起来获得的值是不合逻辑的,但让我们说可以被.