Answers:
PETSc对一些矢量基元使用BLAS,但是它们通常受内存带宽的限制,并且“优化”没有太大的差异,因此它往往不会产生太大的性能差异。
它还使用Lapack进行一些分析,例如Lanczos或Arnoldi对特征值和奇异值的估计,但是这些通常对性能不敏感。
当使用第三方库中的稀疏直接求解器(例如MUMPS,SuperLU,UMFPACK)时,密集的“ 3级”操作通常仅出现在对性能敏感的上下文中,在这种情况下,填充最终会导致密集的问题,而问题又大到足以从中受益呼叫BLAS。
如果您依赖于这些适用于大型问题的稀疏直接求解器,那么值得调整的BLAS实现来构建它,否则差异不大。