DSConv的步骤如下:(I)从预训练网络中,将权重张量按深度方向分成可变长度的块,并对每个块进行量化;(II)使用块浮点(BFP)格式对激活进行量化,其中块的大小与权重张量相同;(III)将激活和权重张量的整数值相乘,以最大化推理速度;(IV)将最终值乘以它们各自的缩放因子,以将各个块的分布移动到正确的范围。 3.1. 权重...