卷积神经网络推理程序在进行卷积乘法运算时,调用custom_lker_cnn将卷积核加载进单元,随后不断调用custom_calcu_cnn计算向量乘法以达到卷积计算的目的。 由于在绝大多数信号的处理算法中,需要大量的乘法运算,而本文使用的CPU内核属于低功耗CPU,没有单周期乘法器和浮点计算单元,为了防止乘法计算拖累算法整体计算速度,影响协...
本发明公开了一种基于RISC‑V架构的卷积神经网络加速装置及其控制方法,所述装置包括:存储器,用于存储数据;主处理器,用于发送拓展指令;协处理器,用于接收主处理器所发送的拓展指令,根据接收到的拓展指令,从存储器中读取输入数据,对输入数据进行分组运算处理,得到输出数据,将所述输出数据存入存储器;所述主处理器还用于...
本发明公开了一种基于RISCV架构的卷积神经网络加速装置及其控制方法,所述装置包括:存储器,用于存储数据;主处理器,用于发送拓展指令;协处理器,用于接收主处理器所发送的拓展指令,根据接收到的拓展指令,从存储器中读取输入数据,对输入数据进行分组运算处理,得到输出数据,将所述输出数据存入存储器;所述主处理器还用于从...
通过基准评测显示,约84%的周期用于图像卷积函数,该函数是由深度嵌套的for循环实现。为了进行简单的3x3卷积,通用RISC-V处理器必须运行9条加载指令、9次乘法运算和8次加法运算,并且存在一些流水线停滞的开销。因此,卷积似乎是优化的主要目标。 图3 卷积加速器原理 所提出的卷积加速器方案如图3所示。它与核心流水线紧密...
东软载波董秘:尊敬的投资者您好:公司基于RISC-V架构的芯片已经量产,型号为ES32VF。该系列芯片为基于E902内核(RV32EMC指令集)的32位MCU,支持大存储容量,高速ADC,多通信接口,宽工作电压,工业级标准,抗干扰能力强等特点,适用领域广泛,包括白色家电、工业控制、智能家电、人机交互、键盘、鼠标、游戏手柄、...
1、本发明的目的在于公开了基于risc-v向量处理器架构的滑动窗口2d卷积计算方法,实现了数据的复用,通过滑动窗口指令,有效避免了数据从cache或内存到寄存器中的拷贝、移动,减少了数据的访存消耗。 2、为了达到上述目的,本发明采用如下方案: 3、基于risc-v向量处理器架构的滑动窗口2d卷积计算方法,包括如下步骤: ...
进一步的,还包括基于risc-v架构定义的指令在协处理器中的执行方法:s1:使用setup-kernel指令指定运算需要的卷积核,控制模块根据参数,将卷积核复制到协处理器内部缓冲区;s2:使用setup-matrix指令指定运算的矩阵块,并将矩阵块复制到协处理器内部缓冲区;之后开始执行计算;根据setup-matrix指令触发协处理器从存储器逐个读取...
本发明的协处理器是这样实现的:一种基于riscv扩展指令的神经网络协处理器,包括扩展指令运算单元,所述扩展指令运算单元连接至一riscvcpu;所述扩展指令运算单元在接收到所述riscvcpu的扩展指令请求时,对每个扩展指令按照从属关系分级到多个指令运算等级中,每一运算等级的每个扩展指令需要用到的运算单元,各运算单元之间的...
一种基于RISC-V的深度可分离卷积神经网络加速器 在人工智能时代,RISC-V作为一种新兴的开源精简指令集架构,因其低功耗,模块化,开放性和灵活性等优势,使之成为一种能够适应不断发展的深度学习模型和算法的新平台.但是在硬件资源及功耗受限环境下,基础的RISC-V处理器架构无法满足卷积神经网络对高性能计算的... ...