据担任Tenstorrent公司首席 CPU 架构师一职的练维汉介绍,“Tenstorrent拥有为神经网络推理和训练量身定制的专有 Tensix 内核,每个 Tensix内核包含5个RISC-V 内核、1个用于张量运算的数组数学单元、1个用于矢量运算的 SIMD 单元、1MB或2MB的SRAM、用于加速网络数据包运算和压缩/解压缩的固定功能硬件。”在实际应用中...
「哪吒」开发板 是全志在线基于全志科技 D1 芯片定制的 AIoT 开发板,是目前还比较罕见的使用 RISC-V SoC 且可运行 GNU/Linux操作系统的可量产开发板。 ncnn是腾讯优图实验室推出的一个为移动端极致优化的高性能神经网络前向计算框架,是目前同样也比较罕见的为 RISC-V 架构做过适配和优化的神经网络框架。 本文...
本文介绍一篇2021年发表于 IEEE International Symposium on Circuits and Systems (ISCAS)的论文。 自从ResNet解决了神经网络层次增多后的衰退问题,深度神经网络的层数不断增加,也带来了巨大的算力要求。加速器设计的一种方法是创建多个加速器基元或处理元(PE)增加吞吐量和并行性。 控制和监视这样加速器上的计算执行会...
其中,AI SoC EIC7702X 采用 8 核 64 位乱序 RISC-V 高性能处理器和自主研发的高效神经网络计算单元(NPU),支持全栈浮点计算,全面加速生成式大模型;拥有丰富的外围扩展接口,在 AI 智能设备等领域具有超高的适应能力;具备强大的音视频处理能力,支持 H.264、H.265 等视频编解码标准及 ACC-LC、G.711、G722.1 等...
在RISC-V加速器和专用处理器领域,中科院计算所泛在计算团队开展了基于RISC-V核心的轻量级神经网络处理器的研究,探索了RISC-V核心在物联网设备中的应用。上海交通大学北斗导航与位置服务重点实验室则开展了基于RISC-V指令集的基带处理器扩展研究项目。从“单点突破”到“遍地开花”,RISC-V处理器核心将打通国内芯片...
在2022年11月,达摩院就推出了首个支持Vector1.0的架构的高性能处理器内核C908,支持INT4数据类型,并全面优化AI算子及算法库。官方的数据称,C908典型神经网络计算的性能比前一代的C906提升了50%以上,在图像分类任务中性能相比C906更是大幅提升了3.5倍。此次玄铁RISC-V生态大会,达摩院更是一口气推出了三款新...
2019年5月,Imagination Technologies也宣布加入了SiFive的DesignShare生态系统。进一步丰富了SiFive的生态,使得从而使得SiFive的客户能够轻松地获取其PowerVR GPU和神经网络加速器IP内核。在设计工具方面,SiFive与Synopsys有深度合作,帮助RISC-V客户快速解决SoC设计当中使用RISC-V CPU面临的验证和实现流程当中的各种挑战。在...
2019年5月,Imagination Technologies也宣布加入了SiFive的DesignShare生态系统。进一步丰富了SiFive的生态,使得从而使得SiFive的客户能够轻松地获取其PowerVR GPU和神经网络加速器IP内核。 在设计工具方面,SiFive与Synopsys有深度合作,帮助RISC-V客户快速解决SoC设计当中使用RISC-V CPU面临的验证和实现流程当中的各种挑战。
V1;以及MIPS公司宣称放弃自研架构而押注RISC-V,目前MIPS正在利用其经过硅验证的CPU技术来加速RISC-V在数据中心等高性能应用中的采用;英特尔宣布开放基于7nm的SiFive IP代工业务;Imagination推出RISC-V CPU IP——Catapult系列为异构计算铺路;Mobileye推出EyeQ Ultra在芯片中配备12个RISC-V内核和神经网络加速器......
实际上,由于神经网络计算的过程中几乎不需要条件判断等操作,规律的乘加操作占据大多数运行时间,两种实现方案并无本质差别。 扩展RISC-V核心的方案优势在于当总线外设较多时,共用了微内核资源,减少了总线开销。而扩展RISC-V核心方案的缺点是对RISC-V编译工具链要做少许修改,增加额外的工作量。