YOLO V3及其轻量级版本YOLO V3 Tiny,凭借其优异的处理速度和准确率,一直是计算机视觉领域的热门选择。FPGA(现场可编程门阵列)作为一种高度灵活的硬件,能够大幅提升YOLO算法在各类设备中的部署效率,因此,通过FPGA实现网络切换成为了研究的新方向。 专利技术深度解析 该专利所描述的基于FPGA的YOLO V3和YOLO V3 Tiny网络切...
金融界2024年12月31日消息,国家知识产权局信息显示,逢亿科技(上海)有限公司取得一项名为“一种基于FPGA的YOLO V3和YOLO V3 Tiny网络切换方法”的专利,授权公告号CN 111967572 B,申请日期为2020年7月。天眼查资料显示,逢亿科技(上海)有限公司,成立于2016年,位于上海市,是一家以从事科技推广和应用服务业...
金融界2024年12月31日消息,国家知识产权局信息显示,逢亿科技(上海)有限公司取得一项名为“一种基于FPGA的YOLO V3和YOLO V3 Tiny网络切换方法”的专利,授权公告号CN 111967572 B,申请日期为2020年7月。 天眼查资料显示,逢亿科技(上海)有限公司,成立于2016年,位于上海市,是一家以从事科技推广和应用服务业为主的企...
逢亿科技的这一新专利旨在通过FPGA技术,实现YOLO V3和YOLO V3 Tiny之间的快速切换,从而大幅度提升算法的运行效率和响应速度。 该方法的核心在于它利用FPGA的并行处理能力,通过动态重配置的方式,在不同的场景下选择适合的YOLO模型进行检测。与传统的处理器相比,FPGA可以在不浪费计算资源的情况下,快速切换到最优模型进行...
YOLOv3-tiny卷积神经网络加速量化并行计算基于对YOLOv3-tiny网络推理加速的研究,提出了一种基于现场可编程门阵列(FPGA)的硬件加速结构,结合可变精度定点量化和量化重训练2种方法在减少数据计算量的同时保证了网络精度.设计了多个维度上的大规模并行计算来提升网络加速性能,采取适应计算阵列的数据存储格式和数据复用策略减少...
YOLOv3-tiny具有优秀的目标检测能力,但模型所需的计算力依然较大,难以实现面向嵌入式领域的应用.提出一种YOLOv3-tiny的硬件加速方法,并在FPGA平台上实现.首先,针对网络定点化设计,以数据精度与资源消耗为设计指标,通过对模型中数据分布的统计以及数据类型的划分,提出了不同的定点化策略.其次,针对网络并行化设计,通过对...
2. 注意输入网络图像的三通道顺序,yolo v3-tiny输入网络的顺序是RGB 3. 输入网络配置为U8,NCHW模式,官网介绍中输入网络支持FP32,因此归一化也可以在CPU上进行 4. 输出网络配置为FP32,NCHW模式,由于CPU模式不支持FP16,因此这里为了统一CPU和NCS设备上代码,统一使用FP32 ...
(1)FPGA硬件计算平台为 RJIBI FACE系列板卡套件 (2)深度学习训练框架:采用YOLO 原作者使用的 Darknet 训练框架 (3)深度学习推理框架:TensorFlow Lite、Caffe2 (4)支持目标检测网络模型:YOLO-V3,YOLO-V3-Tiny (5)目标检测网络模型推理精度(mAP)在COCO数据集上: ...
FPGA神经⽹络部署ZynqUltrascaleYolov3-tinyVGG16 ⼯程描述:该⼯程实现了⼀个通⽤的卷积神经⽹络加速器,成功搭载Yolov3tiny。配合摄像头采集+显⽰器回显环路,构建了⼀个⾼性能实时⽬标识别与检测系统。验证平台:Xilinx Zynq Ultrascale系列xzcu3eg芯⽚,Digilent官⽅Genesys ZU3EG板卡 基本外设...
(1) YOLO-V3 和 YOLO-V3-Tiny 网络的深度学习训练框架,采用YOLO原作者使用的Darknet框架,因为这个框架是开源框架中唯一能完美复现YOLO-V3和YOLO-V3-Tiny网络训练结果的框架。 针对FPGA的深度学习网络加速器性能设计的关键是在具体的计算并行度和访存并行度之间进行一个最有的折中,因为任何计算平台都有其理论的计算...