CSPDarknet53 是算法的核心,用来提取目标特征。由图中可知该主干网络结构中包含了 5 个 CSP 模块。每个 CSP 模块的下采样可以通过大小为 3×3 的卷积核来实现。YOLOv4 网络模型将输入图片的大小定义为 608×608,经过主干网络中的五个 CSP 模型进行特征化提取后,特征图尺寸变化了五次,最终从 608×608 变成了...
Dense-CSPDarknet53配置确保了在训练期间,当输入的图像被转移到网络的较低分辨率层时,以后的特征层从前一层获得特征,从而减少了特征损失。此外,不同的低分辨率卷积层可以重用它们之间的特性,提高了特征使用率。 2.4 使用SPP增强感受野 如图3所示,为了增强目标检测过程中的感受野和分离重要的上下文特征,将SPP块与Dense-...
YOLOv4 使用了上面的 CSP 与下面的 Darknet-53 作为特征提取的骨干。相比于基于 ResNet 的设计,CSPDarknet53 模型的目标检测准确度更高,不过 ResNet 的分类性能更好一些。但是,借助后文将讨论的 Mish 和其它技术,CSPDarknet53 的分类准确度可以得到提升。因此,YOLOv4 最终选择了 CSPDarknet53。颈部(Neck...
1、其一是将DarknetConv2D的激活函数由LeakyReLU修改成了Mish,卷积块由DarknetConv2D_BN_Leaky变成了DarknetConv2D_BN_Mish。 Mish函数的公式与图像如下: 2、其二是将resblock_body的结构进行修改,使用了CSPnet结构。此时YOLOV4当中的Darknet53被修改成了CSPDarknet53。 CSPnet结构并不算复杂,就是将原来的残差块的...
yolov4的CSPDarknet53与yolov3的Darknet-53相比,主要区别: (1)将原来的Darknet53与CSPNet进行结合,形成Backbone网络。 (2)采用SPPNet适应不同尺寸的输入图像大小,且可以增大感受野; (3)采用SAM引入空间注意力机制; (4)采用PANet充分利用了特征融合;
Yolo-V4算法中对网络进行了改进,使用CSPDarknet53。网络结构如下: Yolo-V4与Yolo-V3上相比较: (1)对主干网络进行了修改,将原先的Darknet53改为CSPDarknet53,其中是将激活函数改为Mish激活函数,并且在网络中加入了CSP结构。 (2)对特征提取过程的加强,添加了SPP,PANet结构。
其中没有详细展开backbone部分,其实backbone之前在解读CSPNet的时候就讲过了,YOLOv4使用的是CSPDarknet53作为Backbone。 4. 总结 读了这篇文章以后,给人留下深刻印象的不是创新点,而是Bag of freebies和Bag of specials。所以有人多人都说YOLOv4是拼凑trick得到的。YOLOv4中Bag of freebies和Bag of Specials两部分...
通过CSP结构,YOLOv4网络尺寸得以缩小,检测精度不减反增,检测速度提升。CSPDarknet53是模型的核心,负责提取目标特征。该主干网络包含5个CSP模块,通过3×3卷积核实现下采样。输入图片大小定义为608×608,经过5个CSP模块的特征提取,尺寸从608×608变为19×19,实现特征图快速降维。CSPDarknet53作为主干...
论文研究了不同主干网络对检测准确率的影响,可以看到CSPDarknet53能更好地适应各种改进。 Influence of different mini-batch size on Detector training 论文对比了不同的mini-batch大小下的检测准确率,在加入BoF和BoS训练策略后,mini-batch的改变几乎对准确率没有影响。
从该推断出发,CSPDarknet比DarkNet具有更好的计算量优势(k>1)。CSPDarkNet53每个阶段的残差数量分别为1-2-8-8-4。为得到更好的速度-精度均衡,作者将首个CSP阶段转换为原始的DarkNet残差层。 Neck 更有效的降低参数量,作者将PAN架构引入到YOLOv4中。PAN架构的处理流程见下图a,它主要集成了来自不同特征金字塔的...