另外 cuBLAS 也新加入了一个高度优化的 cublasHgemm() 实现,以在这类设备上提供高性能的半精度浮点的矩阵乘法。 NVIDIA 的 GPU 完整支持符合IEEE 754 floating point standard (2008)标准的半精度浮点数据类型,具体定义如下: 符号位: 1 bit 指数位: 5 bits 有效数位: 11 bits (10 位显式) 半精度浮点范围:...