本发明涉及一种基于SIMD技术的卷积神经网络加速装置及方法,属于嵌入式卷积神经网络加速硬件技术领域。本发明针对当前神经网络应用中的突出矛盾,提出一种基于SIMD技术的神经网络推理加速装置。本发明首先设计一个运算流程,以满足神经网络算法中的算子功能,然后面向该计算流程,进行硬件功能单元设计,以软件定义硬件的方式实现系统...
优选地,所述卷积阵列包括若干个simd乘累加器、若干个横向求和单元、一个bn单元、一个relu单元、一个数据广播单元,若为3x3卷积运算,卷积阵列具体用于根据卷积控制器的硬件微操作指令,首先通过异步dma将外部存储器中的神经网络特征图和卷积权重分别加载到数据缓冲区和权重缓冲区;然后从数据缓冲区,按照直接卷积方式,读取m...