CSP结构可以有效地减少计算量,提高模型的推理速度。 四、Neck网络设计 1. SPP结构 YOLOv5的Neck网络采用了SPP(Spatial Pyramid Pooling)结构,该结构通过对特征图进行不同尺度的池化操作,提取出多尺度的上下文信息。这样做可以增强模型对于不同尺寸目标的检测能力,提高检测的准确性。 2. PAN结构 PAN(Path Aggregation ...
二、CSP结构分析 1、总括 YOLOv5s的CSP结构是将原输入分成两个分支,分别进行卷积操作使得通道数减半,然后一个分支进行Bottleneck * N操作,然后concat两个分支,使得BottlenneckCSP的输入与输出是一样的大小,这样是为了让模型学习到更多的特征。 YOLOv5中的CSP有两种设计,分别为CSP1_X结构和CSP2_X结构。 2、CSP1...
用cat连接这些采样图,生成通道数为12的特征图 # return self.conv(self.contract(x)) 1.4 CSP结构 yolo v4 与yolov4不同点在于,yolov4中只有主干网络使用CSP结构,而在yolov5中设计了两种CSP结构,CSP1_X应用于主干网络,CSP2_X结构应用于Neck中。 yolo v5 在neck部分,v4和v5中一样都采用FPN+PAN结构,v4的ne...
1、网络结构: Backbone: Focus + CSPX + SPP focus 作用: 通过slice操作, 将 W、H 上的信息融入到通道上,且在下采样过程不带来信息丢失。再使用3 × 3的卷积对其进行特征提取,使得特征提取得更加的充分。 csp 结构: 将feature map拆成两个部分,一部分进行卷积操作,另一部分和上一部分卷积操作的结果进行conc...
YOLOv5中发挥最主要功能的是CSP模块,CSP模块结构如图9所示。在YOLOv4中只在Backbone中使用了CSP模块,而YOLOv5的Backbone和Neck中均用到了CSP模块。CSP模块可以在特征图中综合反映梯度的变化,降低模型的参数量和维度,从而增强模型的推理速度...
CSPDarknet53是在yolov3主干网络Darknet53的基础上,借鉴2019年的CSPNet的经验,产生的Backbone结构,其中包含了5个CSP模块。 每个CSP模块前面的卷积核大小都是3*3,stride=2,因此可以起到下采样的作用。因为Backbone有5个CSP模块,输入图象是608*608,所以特征图变化的规律是:608-->304-->152-->76-->38-->19。
Yolov5的neck部分用到了上面提到的CSP结构,我觉得目的就是为了能够更好地与前面网络提取的特征进行融合,其余地部分就与Yolov4没有区别,主要用FPN+PAN来进行下采样和上采样,给出三个不同尺度的featuremap,用来进行预测。 4.Loss Yolov5相较于之前的版本,最大的改动就在这个部分,而这个部分最大的改动就是对于正样...
CSP结构:YOLOv5的Backbone使用了Cross Stage Partial Network(CSPNet)结构,这是一种减少计算量的技术。CSP通过在卷积层之间共享权重,减少了模型的参数数量和计算量,同时保持了特征提取的效率。 Darknet架构:Darknet是一个为YOLO系列优化的深度学习框架,它以速度快和资源消耗低而著称。Darknet53是Darknet系列中的一个变...
C3其结构作用基本相同均为CSP架构,只是在修正单元的选择上有所不同,其包含了3个标准卷积层,数量由配置文件yaml的n和depth_multiple参数乘积决定。该模块是对残差特征进行学习的主要模块,其结构分为两支,一支使用了上述指定多个Bottleneck堆叠,另一支仅经过一个基本卷积模块,最后将两支进行concat操作。
YOLOv5网络结构 部分二:Backbone骨干网络 Backbone骨干网络主要作用是提取图片的特征,并不断缩小特征图,Backbone包含了CBL模块、Focus模块、CSP模块和SPP模块。 (1)CBL模块 CBL为标准卷积模块,包括普通卷积层Conv、批量归一化层BN和LeakyReLU激活函数层,如下图所示: ...