CUDA SGEMM优化笔记 - linn-ylz. com 本篇博客记录了最近学习的 CUDA 单精度 GEMM 算法的优化过程。 GEMM 算法是指 General Matrix Multiplication 算法,可以说是大多数线性代数算法的基础,也是目前热门的深度学习中最常用的基础计算,因此优化 GEMM 算法对于许多的应用有着重大意义。
CUDA GEMM优化策略:提升并行计算性能的实用指南 在众多并行计算任务中,矩阵乘法(gemm)因其广泛的应用和计算密集性成为了cuda优化的重点。本文将介绍一系列cuda gemm优化策略,帮助读者提升程序的性能。