整数 matmul 的 GPU 库 | 溢出容忍

计算科学 矩阵 布拉斯 密集矩阵 固定点
2021-12-24 04:48:48

是否有任何实现矩阵乘法的高性能整数 BLAS 库,即 i32gemm 和 i64gemm ?我需要将它们用于加密应用程序并且可以容忍溢出,即我不需要内核进行任何环绕检查。

Igemm 和 Fgemm 的区别在于后者保留了高位,而前者保留了低位。我的应用程序将对密码而不是实际数据执行计算。由于数据的选择方式使得乘积矩阵的任何元素(全部是有符号的)都不需要超过 32 位,因此应用程序可以容忍密码溢出。

1个回答

我认为cuBLASOpenCL是您正在寻找的库。