一个小的非线性方程组(大小约为 12 ✕ 12)需要反复求解(数百万次);每次参数/系数都有一些变化(尽管方程组总是相同的)。
大多数求解器对像这样的小型系统不是很优化,只有在使用更大的矩阵时才能实现更高的“GFlops”(例如,512 ✕ 512)。
目前它正在使用基于MINPACK(鲍威尔混合方法与布罗伊登雅可比更新)的实现,而不使用BLAS(因为即使是小矩阵的BLAS实现似乎也更慢)。
是否有针对此类问题优化的求解器实现(例如英特尔 MKL、PETSc 或 Ceres 中的求解器)?