CUTLASS(CUDA Templates for Linear Algebra Subroutines and Solvers)是一个由 NVIDIA 开发的 C++ 模板库,用于高效实现和加速在 NVIDIA GPU 上进行的线性代数运算。

CUBLAS 相比,CUTLASS 是开源的,而且是高度可定制、灵活的(本身是一个 C++ 模板库)。