在cuSPARSE中,您可以通过调用cusparse<t>csrsv2_solve()
. 但是,您需要先调用cusparse<t>csrsv2_bufferSize()
和cusparse<t>csrsv2_analysis()
。
从我在文档中读到的内容看来:
csrsv2
可能需要额外的内存,并csrsv2_bufferSize()
告诉您应该是多少。csrsv2_analysis()
分析系数矩阵的稀疏模式。它可能会或可能不会提高csrsv2_solve()
.
文档说:
csrsv2_analysis()
报告结构零并计算级别信息。- 级别信息可能不会提高性能。例如,三对角矩阵没有并行性。
csrsv2_solve()
报告第一个数字零,包括结构零。
所以这是我不明白的:
- 那些东西是什么:结构零、数字零、级别信息?
- 为什么三对角矩阵没有并行性?并行性在这里意味着什么?
我猜结构零和数值零与矩阵的奇异性有关,但我需要对此进行澄清。