深度学习论文: EasyQuant: Post-training Quantization via Scale Optimization及其PyTorch实现 int16 累加器累加最多八次的方式,使得推理速度优于权值和激活 int8 量化,中间 int16 累加器只能累加两次(溢出)的方式,同时还可以比较好的保持量化后算法的精度。 4 Experime