YOLOv3的neck部分使用的是FPN,这一部分也叫特征金字塔,它的作用是将多尺度的出入进行特征融合。 backbone部分输出的shape分别为(13,13,1024),(26,26,512),(52,52,256)。将这三个输出分别输入到FPN中,我们先看(13,13,1024)这一个输入,经过5次卷积后,输出(13,13,512),然后兵分两路,一路传入到head中,一...
如上图所示,backbone部分输出的shape分别为(13,13,1024),(26,26,512),(52,52,256)。将这三个输出分别输入到FPN中,(13,13,1024)这一个输入,经过5次卷积后,输出(13,13,512),然后兵分两路,一路传入到head中,一路再经过一个卷积和上采样,得到(26,26,256),将这个输出和backbone的第2个输出也就是(26,...
Neck:在Backbone和Head之间提取不同特征图,用于多尺度检测 Head:检测头,用于预测目标的类别和位置 YOLOv3有三个输出特征层(13x13x255,26x26x255,52x52x255),分别负责检测大中小三个尺度的目标,提升了对小目标的检测能力。 以13x13x255层输出为例,表示网络最后输出13X13个格子,每个格子有三个anchor,每个anchor...
本文精读的是mmdetection v2.23.0版本的YOLOv3版本,我们选用config/yolo/yolov3_d53_320_273e_coco.py 作为分析对象,后续对backbone为mobilenet的YOLO进行分析,如果错误请多多指教。 整体网络 YOLOv3参数量及FLOAPs估计 MMDet把目标检测的过程类比为人体结构,分为 Backbone、Neck和Head三个过程。YOLOv3也包含Backbone、...
YOLOv3整体网络结构分为了三大部分,分别为backbone,neck和head。它的维度变换如下: DarkNet53 YOLOv3使用的backbone部分为DarkNet53,这一部分也成为特征提取网络,和我们分类的网络是基本一致的,这部分是通用的。也就是说,我们之前讲解过的Mobilenetv3也可以放在YOLOv3的backbone,来实现检测任务。
YOLOv3的网络结构可以分为三个部分:Backbone(主干网络)、Neck(特征融合)和Head(检测头)。其中,Backbone负责提取图像的特征;Neck部分通过特征金字塔网络(FPN)结构将不同尺度的特征图进行融合,以提高模型对不同大小目标的检测能力;Head部分则负责在每个特征图上预测目标的边界框、置信度和类别。 多尺度检测 YOLOv3在三...
Neck:SPP,PAN Head:YOLOv3 YOLOv4 = CSPDarknet53+SPP+PAN+YOLOv3 其中YOLOv4用到相当多的技巧: 用于backbone的BoF:CutMix和Mosaic数据增强,DropBlock正则化,Class label smoothing 用于backbone的BoS:Mish激活函数,CSP,MiWRC 用于检测器的BoF:CIoU-loss,CmBN,DropBlock正则化,Mosaic数据增强,Self-Adversarial 训练,...
2.1 Backbone的创新 YOLOV3在darknet-19的基础上进一步扩充了深度,使用darknet-53进行特征提取,其网络结构如下: 进步之处 1、充分借鉴了resnet网络的残差结构,使得网络能够达到很深程度的同时避免了梯度消失的问题; 2、去除了池化层而改用步长为2的卷积层的方式进行特征图降维,更好的保持了信息传递; ...
Backbone:CSPDarknet53 Neck:SPP,PAN Head:YOLOv3 YOLOv4 = CSPDarknet53+SPP+PAN+YOLOv3 其中YOLOv4用到相当多的技巧: 用于backbone的BoF:CutMix和Mosaic数据增强,DropBlock正则化,Class label smoothing 用于backbone的BoS:Mish激活函数,CSP,MiWRC 用于检测器的BoF:CIoU-loss,CmBN,DropBlock正则化,Mosaic数据增强,...
yolov3模型主要由三部分组成,分为backbone、neck、head。其中主干网络叫做darknet53,这是一个分类网络,通过卷积池化及归一化等操作,最后再通过三个上采样就能覆盖到大中小三类目标。在训练阶段中,首先通过darknet网络进行特征提取,将特征提取组成的特征图放入结构化网络中得到三个尺度的特征图,再将这三个特征图输入到...