我想使用特定库预测特定架构上密集线性代数运算的运行时间。我想学习一个近似函数的模型
输入尺寸运行
用于矩阵乘法、逐元素加法、三角求解等操作。
我怀疑一旦超出了适合缓存的问题大小,由于操作的规律性,这些运行时大多是可预测的。
问题:
- 这个假设现实吗?运行时函数是否可能几乎是确定性的?
- 我可以假设这个函数在输入的大小上是多项式的吗?(即我希望密集矩阵乘法看起来像为了和一些标量系数)
- 在某处有这方面的工作吗?
- 我目前的计划是做最小二乘回归正则化器。还有其他建议吗?
编辑:要清楚我正在寻找运行时,而不是 FLOP 或任何其他常见的性能指标。我愿意将自己限制在一种特定的架构上。