目前尚不清楚 PTX 是如何在 fatbinary 中压缩的。我正在做一些研究,通过查看二进制文件,它似乎是一种 LZ77(或 LZSS?)。我准备了一些测试:
小型 PTX。一个简单的 vec_add (实现不佳):Input、Output和CUDA Source。
更大的 PTX。来自 Rodinia Benchmarks 的 lavaMD:输入、输出和CUDA 源
注意:问题与NVIDIA 开发者论坛上的以下线程相同 (我是该线程的作者)。
目前尚不清楚 PTX 是如何在 fatbinary 中压缩的。我正在做一些研究,通过查看二进制文件,它似乎是一种 LZ77(或 LZSS?)。我准备了一些测试:
小型 PTX。一个简单的 vec_add (实现不佳):Input、Output和CUDA Source。
更大的 PTX。来自 Rodinia Benchmarks 的 lavaMD:输入、输出和CUDA 源
注意:问题与NVIDIA 开发者论坛上的以下线程相同 (我是该线程的作者)。