论文:ieeexplore.ieee.org/doc 单位:Intel 会议:HPCA 2024 摘要: 稀疏矩阵密集矩阵乘法 (SpMM) 是一个重要的内核,具有广泛的应用领域,包括机器学习和线性代数求解器。在许多稀疏矩阵中,非零值的模式是不均匀的:非零值形成密集区域和稀疏区域,而不是均匀分布在整个矩阵中。我们将此属性称为矩阵内异质性 (IMH)。
论文题目:BitWave: Exploiting Column-Based Bit-LevelSparsity for Deep Learning Acceleration(BitWave:利用基于列的位级稀疏性加速深度学习) 会议:2024 IEEE International Symposium on High-Performance Computer Architecture (HPCA) 研究动机: 当前的bit串行加速器存在以下问题: 通过软硬件协同设计引入结构化比特稀疏,往...
PAPER-1 NEO: 通过将浮点数计算应用于同态加密加速,并进一步优化算法表达效率及数据排布,我们进一步提升了基于GPU加速CKKS的性能,同时保持了对64bit高精度数据的支持能力。这也是继TensorFHE(HPCA2023)和WarpDrive(HPCA2025)之后,我们在GPU加速同态加密领域的第三篇论文。未来我们还将继续探索基于商用硬件提升同态加密...